Day by Day, Site by Site

Open source, Some Code, Troubleshooting, Good Links

Автоматизация скачивания музыки с сайта студии Лебедева

   python music

Музыкальный набор на сайте Лебедева манит. То что нужно что бы создавать атмосферу рабочего процесса)

Очень не хотелось возиться с плейером на сайте, так он ужасен, почему-то, чуть менее, чем полностью.

Когда я слушал самые старые треки, что бы до них добраться, нужно было полностью спуститься вниз страницы. С учетом того, что она сделана с использованием технологии AJAX, нужно тупо ждать, зажав клавишу Page Down. Даже когда я до них добирался, не все треки воспроизводились. Да еще это уведомление про куки, которое загораживает прогресс бар плейера, и с ним ничего не сделать.

Я обескуражен, почему так все плохо сделано, на ведущем сайте в Рунете, посвященном разработке сайтов.

Если кто то меня услышит, то плейер нужно переработать, потому что он никуда не годится. Я негодую! Хотя, может быть, я ничего в этом и не понимаю.

В общем, хотелось скачать всю музыку разом, и не париться. Пришлось привлечь наших фронтендеров и провести расследование.

Результатом расследования явился скрипт для скачивания mp3 из архивов студии Лебедева. В браузере скрипт отображается с не корректной кодировкой, но если его скачать и работать с ним локально, то все хорошо.

Далее возникала проблема с именами файлов. Когда то на этом месте был bash скрипт по перименованию файлов. Но теперь в нем необходимости нет, так как я переписал скрипт с использованием библиотеки которая не качает файлы повторно, и соответственно проблема с лишними символами в именах ушал.

Обновление 1: Если повторять мое расследование, то с оригинальными данными выдернутыми с сайта, при скачивании файлов, произойдет ошибка на файле с id 404. Это очень символично)) Я воспринял это как пасхалку. В моем скрипте данные уже поправлены.

Обновление 2: На всякий случай напишу, что полное собрание сочинений, на момент поста, 112 Гб.

Обновление 3: Переписал скрипт и обновил данные на актуальные, поправил ошибку 404. Убрал скрипт переименования файлов. За 2024 год записей практически нет. Веселья ушло, видимо Лебедев решил не устраивать пир во время чумы. Ну и правильно. Полное собрание сочинений, на момент обновления, 114 Гб. Спасибо @vitaly_zdanevich за участие.