У меня есть опыт парсинга сайтов, интернет-магазинов, каталогов в формат Excel (xlsx, xls, csv) или другой текстовый формат. Вот примеры: https://yadi.sk/d/ArF3SZqAydbP3g Я спарсил более 300 сайтов. Иногда, я, даже, брал прайс-лист, сопоставлял товары со спарсенными мною данными сайта, также анализировал, есть ли фотография на товар и добавлен ли он в интернет-магазине. Такой пример есть по ссылке выше. Добавьте мой кворк в избранное, справа от картинки, вверху. В этот кворк входит:Парсинг 1 сайта. Формат файла Excel (xlsx, xls, csv). Набор из 8 очевидных полей со страницы (название, категория, цена, ссылки на картинку или какие-то другие данные). Без вариаций товара (цвета, размеры и пр). Скачивание одной основной фотографии со страницы. Объем до 20000 позиций. Все данные должны быть открыты и доступны в html, т. е. нет вывода данных подгрузкой контента или скриптами.