Правообладателей разочаровал робот «Яндекса» для поиска пиратских ссылок
Робот «Яндекса», который должен был стать одним из основных инструментов поиска пиратского контента в интернете, не оправдал ожиданий правообладателей. «Яндекс» обещает «повысить точность» программы
Фото: Станислав Тихомиров / ТАСС
Подписавшие в ноябре прошлого года антипиратский меморандум правообладатели направили в «Яндекс» письмо, в котором высказали свое мнение относительно созданной интернет-компанией программы для поиска ссылок на пиратский контент. В письме, датированном мартом, правообладатели указывают, что «Яндекс» не предложил действенного инструмента выявления ссылок с нелегальным видео. Об этом РБК рассказали три источника в медиакомпаниях.
Ассоциация «Интернет-видео», объединяющая онлайн-кинотеатры ivi.ru, Okko, Megogo, TVZavr, Amediateka и VIP Viasat Play, не использует робот «Яндекса» для выявления пиратских ссылок для их последующего внесения в реестр, сообщил РБК гендиректор ассоциации Алексей Бырдин (ему также известно о письме правообладателей). По его словам, предложенный «Яндексом» инструмент не обладает ни точностью, ни корректностью работы с данными.
В чем претензии правообладателей и насколько они обоснованны, разбирался РБК.
Что такое антипиратский робот «Яндекса»
Правообладатели и владельцы интернет-ресурсов 1 ноября подписали так называемый антипиратский меморандум. От имени правообладателей под документом поставили свои подписи руководители ВГТРК, «Газпром-Медиа», Национальной медиа группы, «Первого канала», «СТС Медиа», объединяющей онлайн-кинотеатры ассоциации «Интернет-видео», Ассоциации продюсеров кино и телевидения и принадлежащего «Яндексу» сервиса «Кинопоиск». Со стороны интернет-площадок — «Яндекс», Rambler Group, Mail.Ru Group и RuTube.
В соответствии с меморандумом ссылки на пиратский контент по заявлению правообладателей вносятся в специальный реестр, после чего они в течение шести часов должны быть удалены из поисковой выдачи. Кроме того, подписавшие меморандум интернет-площадки должны удалять внесенный в реестр пиратский контент из своего видеохостинга и других сервисов. Срок действия меморандума ограничен 1 сентября 2019 года: к этому времени в антипиратское законодательство должны быть подготовлены поправки, соответствующие положениям меморандума.
Робот от «Яндекса» появился по собственной инициативе интернет-холдинга в марте этого года, в антипиратском меморандуме он не упоминается.
Как пояснил представитель «Яндекса», созданная программа позволяет искать интернет-страницы с контентом, которые похожи на те, что уже попали в антипиратский реестр, — для этого применяются принципы машинного обучения, рассказал «Ведомостям» представитель интернет-компании, не объяснив принцип работы робота.
Благодаря новой программе «Яндекс» за короткое время нашел несколько миллионов страниц с пиратским контентом, рассказывал операционный и финансовый директор компании Грег Абовски. По его мнению, это «ускорит процесс формирования реестра, а борьба с пиратством станет эффективнее».
Почему робот не нравится правообладателям
Робот действительно находит ссылки на сайты с признаками нарушения (например, на этих сайтах может быть запись «Игра престолов» смотреть онлайн»), но самого нарушения — наличия видеоплеера — на выявленных «Яндексом» страницах не оказалось, рассказывает Алексей Бырдин.
«Яндекс» разослал правообладателям файл с 3 млн URL-адресов, который у части правообладателей открылся в текстовой программе «Блокнот», а у части компаний не открылся совсем, утверждают представители двух медиакомпаний. По их словам, этот контент в первой версии файла не был разделен по принадлежности тому или иному правообладателю, во второй раз «Яндекс», выполнив просьбу компаний, рассортировал ссылки лишь частично.
Но и к найденным ссылкам у правообладателей возникли претензии. Один из них, как рассказывают собеседники РБК, провел выборочную проверку 1 тыс. ссылок, 67% из них оказались нерелевантными: на этих сайтах вообще не было никакого видео либо оно было легальным. Прочие ссылки не имели отношения к контенту данного правообладателя. И только две содержали пиратское видео.
Робот «Яндекса» был бы полезным, если бы не просто находил ссылки, но еще и анализировал их, указывают собеседники РБК. По их словам, эту работу для некоторых правообладателей сейчас выполняет специализирующаяся на кибербезопасности Group-IB.
Какова версия «Яндекса»
«Мы будем постоянно работать над повышением точности инструмента», — заверил РБК представитель интернет-холдинга. Он настаивает, что буквально на днях компания улучшила разметку ссылок. «В результате объем новых выборок заметно сократился и стал релевантнее. Новую выгрузку мы уже отправляем нашим партнерам», — добавил представитель «Яндекса».
Как еще ищут нелегальные ссылки
Руководитель департамента инновационной защиты бренда и интеллектуальной собственности Group-IB Андрей Бусаргин рассказал, что в поисках нелегального контента страницы проверяют на два параметра. «Во-первых, речь идет именно о том фильме, который ищем и защищаем. Для этого работает ML-алгоритм, анализирующий содержимое страницы, — пояснил Бусаргин. — Во-вторых, на этой странице действительно можно посмотреть онлайн или скачать фильм: страница анализируется на присутствие непосредственно пиратского контента — ищутся торрент-файлы, плееры для онлайн-просмотра и т.д. Полученные видео и видеопотоки сверяются с эталоном».
По его словам, для успешного функционирования системы оценки наличия пиратского контента на странице решаются две принципиально разные задачи — это оценка соответствия страницы контенту, а также оценка наличия несанкционированного доступа к нему. «Первая задача — классический алгоритм поисковой системы — в среднем занимает непродолжительное время. После успешного установления соответствия страница может перейти на вторую стадию — установление несанкционированного доступа к контенту», — рассказывает собеседник РБК. При решении второй задачи проявляется главная сложность — интеграция технологии «компьютерного зрения» и других методов анализа. «Но в случае грамотного применения алгоритма машинного обучения вердикт может быть выдан на лету», — добавил он.