Блог

Новые алгоритмы ленты новостей

12.08.2019 07:48:45

На сегодняшний день поток общедоступной информации настолько велик, что следить за ним становится с каждым днем все труднее. Каждый день появляются сайты, которые пытаются освещать картину дня, паблики в социальных сетях, новостные агрегаторы. С одной стороны - это все очень здорово, но с другой стороны - найти важную для пользователя информацию становится сложнее.

Чтобы решить эту проблему, мы предлагаем инструмент историй.

Как работает механизм историй

Механизм историй - это алгоритм машинного обучения, главной задачей которого является объединение новостей в группу на основании их содержимого. Если две новости повествуют об одном и том же событии, то они с помощью нейросети, будут объеденены в одну группу. Эта группа и называется историей.

Данный механизм помогает пользователю увидеть новости из разных источников на одну и ту же тематику. Тем самым мы заботимся о том, чтобы наш пользователь мог получить информацию из разных независмых друг от друга источников.

Где найти истории на сайте

Чтобы показать картину дня в разных разделах, которые присутсвуют на сайте, на главной странице сайта выводятся свежие истории по этим разделам. Кроме этого в каждом разделе сайта присутсвует блок с историями в самом верху. Этот блок представляет из себя 4 свежие истории и 4 истории, которые собрали в себе наиболшее число новостей.

Чтобы максимально полностью охватить событие в историях добавлен механизм похожих событий. Он располагается справа от основной колонки над блоком Главные новости. В этом блоке выводятся новости, которые имеют непосредственное отношение к истории, на странице которой вы находитесь. Тем самым мы стараемся максимально полно осветить событие на основе информации, предоставляемой нам нашими партнерами.

Внутри каждой истории есть кнопки социальных сетей. Вы сразу же можете делиться понравившейся вам историей в своих социальных сетях.

Если вам понравилась история, но у вас нет времени на ее прочтение, вы можете добавить ее в закладки своего браузера, нажав на соотвествующую кнопку.

Парсинг без RSS

При подготовке информационной базы, мы обнаружили, что не все сайты имеют RSS канал. Чтож, это не стало для нас проблемой. Чтобы максимально повысить охват собираемых нами новостей мы разработали полуавтоматический режим парсинга партнеров, для работы которого не нужен RSS фид. Если вы хотите стать партнером, теперь вам не нужно делать ровным счетом ничего (за небольшим исключением в особых случаях).

Дуров и новости

16.06.2019 13:14:15

7 июня 2019 года Павел Дуров, основатель мессенджера Telegram, опубликовал на своем канале информацию о том, что он хочет сделать новостной ресурс (агрегатор новостей).

Но зачем? Ведь телеграм, в первую очередь, это мессенджер для общения. Но, если основатель захотел, то кто мы, чтобы его отговаривать. Но вот высказать свое мнение мы можем.

Павел пишет, что это делается для того, чтобы власти государств не могли препятствовать распространению актуальной информации. Но эту самую информацию публиковать будут новостные источники, а ведь если они заблокированы, то и телеграму получать ее будет неоткуда. (кроме, конечно же, возможности передачи этой информации через закрытый новостной фид). А тогда чем это отличается от webinnews? Мы получаем информацию как с открытых источников, так и с помощью xml фидов. Кроме того источники информации могут быть совершенно любые: федеральные СМИ, youtube каналы, паблики во Вконтакте, другие новостные агрегаторы.

Также если они вынуждены предоставлять информацию о клиентах, то независимо от того, будет ли новость опубликована в телеграмме или на самом источнике, по закону сайты будут вынуждены предоставить эту информацию государству. Мы же не храним о пользователе никакой информации, которую нельзя получить из общедоступных источников, так как у нас даже нет своей регистрации на сайте, а все, что мы берем о пользователе из социальных сетей не несет в себе угорозы для самого пользователя (ИД в соц сети, или иногда почта). Свыше этого мы не можем предоставить даже через судебный запрос.

Также нас, как основателей webinnews, всегда настораживал момент с умной лентой. У нее есть огромный минус: если любопытный человек пару раз кликнет на новость со сплетней или же просто кликбейтовый заголовок, то алгоритмы, заложенные в основу рекомендательной ленты, начнут подсовывать информацию такого характера. А она может быть более не интересна. На данном этапе мы не ввели умную ленту, потому что считаем, что она не оправдывает себя. Заходя на новостной ресурс, человек должен в первую очередь получать актуальную картину дня, а не все подряд, что вовлечет его на несколько часов в бессмысленное время препровождение. Также мы заходим на новостные сайты, чтобы узнать что-то конкретное. В этом могут помочь как поиск так и новости раздела. Мы же пошли дальше и в личном кабинете пользователя сделали возможности, позволяющие получать нужную информацию всего в пару кликов. Подробнее можете прочитать в разделе помощи.

К тому же не надо забывать, что есть рейтинги и мнения людей, которые могут и должны вносить коррективы в расположение контента. У нас для этого введены watchings. Данный механизм позволяет видеть пользователям, что сейчас актуально и на что пользователи обращают больше внимания. Умная лента в том виде, в котором она реализована, скажем, на яндексе такого не делает. А если и делает, то не прозрачно для пользователя.

Нельзя обделить и такой большой новостной пласт, как новости спорта. Попробуйте поискать в интернете новости Бокса или UFC\MMA. Это достаточно проблемно. Что же касается результирующих таблиц и расписания боев или матчей — то эту роль на себя взял частично google и другие поисковые системы. Но мы считаем это не правильным. Не нужно в одну систему пичкать все подряд. Стив Джобс это знал и сделал прекрасные устройства и приложения.

На webinnews представлен раздел спорта, где представлены актуальные новости, таблиц и расписания мероприятий.


Дизайн 2.0 и новый функционал

01.04.2019 18:30:52

Мы рады представить вам новый дизайн и новую функцианальность в большом обновлении системы Новости Интернета

Дизайн

Дизайн сайта кардинально изменился. Мы убрали серый пасмурный фон страниц. Вместо него добавили белый и теплый.

На главной странице теперь выводятся самые просматриваемые новости из каждого раздела первого уровня. А справа - самые просматриваемые новости со всех разделов. Тем самым мы повышаем актуальность выдачи информации для пользователя на главной странице сайта.

Также на сайте исчезли сомнительные блоки и разная верстка одинаковых областей. Теперь вы не увидите новости, которые в одном месте выглядят так, а в другом месте выглядят иначе. Мы за удобство использования сайта и получения информации.

Полностью перераработана верстка спортивных событий и верстка турнирных таблиц. Мы сделали крупнее цифры и названия команд, а из турнирных таблиц убрали ненужные поля. Все поля можно просмотреть на дательной странице турнирной таблицы. Благодаря этим изменениям мы повысили читаемость текста в мобильной версии сайта.

Вотчинги

Вотчинги - это механизм лайков и дизлайков, который напрямую влияет на положение новости в выдаче. При клике на "палец вверх" вы к просмотру новости добавляете +1, а при клике на "палец вниз" - -1 к просмотрам.

Теперь не обязательно переходить в саму новость, чтобы сделать ее популярной, достаточно просто нажать на "палец вверх". По вотчингу новости ранжируются в выдаче как в личном кабинете, так и в правой колонке, когда в ней отображаются популярные новости, а также на главной странице.

Раздел помощи

Новости Интернета проектировался как простая система для получения контента. Но при работе с любым простым интерфейсом на первых порах возникают сложности в понимании того, как работает тот или иной функционал. Для этого мы разработали страницу помощи. На этой странице собраны самые популярные вопросы и ответы на них.

Вверх