Мы признаём, что вчера Яндекс.Новости отставали от картины дня. Скорее всего, дело в том, что алгоритм кластеризации, который склеивает новости в сюжеты, а сюжеты — в темы, не всегда мог объединять в одну тему, например, сообщения о задержаниях во Владивостоке и об аресте Навального в Москве. Иными словами, временами агрегатор мог рассматривать одну большую, сложную и географически обширную тему про протесты как несколько разных тем, что, в свою очередь, могло повлиять на качество работы сервиса. Точно так же алгоритм срабатывает, когда есть много новостей про ДТП с разными людьми в разных городах. Он полагает, что это разные события, и не объединяет их в общий сюжет.
Пока неточная работа алгоритма кластеризации — всего лишь гипотеза; мы по-прежнему разбираемся, как 26 марта сообщения в Яндекс.Новостях собирались в сюжеты и в темы. Если ошибки и правда были, мы будем на них учиться. Однако ситуация в целом непростая — мы агрегатор, и искусственно поднимать ту или иную тему в условиях молчания крупных СМИ, очевидно, не можем.
Следующая запись: Ссылки оптом: «Фабрика троллей» Пригожина контролирует 16 порталов с аудиторией более 36 млн человек ...
Лучшие публикации