Философия поиска, или Разработчики, которые создают Нейросети, которые создают Симулякры

Философия поиска, или Разработчики, которые создают Нейросети, которые создают Симулякры

07.02.2023 0 Автор Дмитрий Разахацкий
Print Friendly, PDF & Email

Перечитал любопытный документ, опубликованный разработчиками Яндекса в 2016 году. В нем они описали свои эксперименты по работе с нейросетями для улучшения технологии поиска и качества результатов поисковой выдачи. В принципе, никаких супер-открытий на начало 2023 года оттуда я сделать не смог, если не считать одного. Разработчики продолжают ошибаться не только в частностях и деталях, но и в базовых подходах и методике. Далее подробнее с аналогиями из жизни.

Чтобы понимать, о чем дальше пойдет речь, с чем я не согласен и спорю, желательно прочитать две следующие статьи:

  1. Искусственный интеллект в поиске. Как Яндекс научился применять нейронные сети, чтобы искать по смыслу, а не по словам – https://habr.com/ru/company/yandex/blog/314222/
  2. От Ламарка к Дарвину… и обратно – https://elementy.ru/nauchno-populyarnaya_biblioteka/430567/Ot_Lamarka_k_Darvinu_i_obratno

В первой статье описывается подход разработчиков поисковика и эксперименты с нейросетью. Если вкратце, проблема с качеством стала сильно заметной, когда возросло количество уникальных запросов – базовый уровень показа результатов по точному соответствию с различными поправками “на ветер” перестал давать приемлемые ответы почти в каждом втором случае, тем более оптимизаторы тоже не спали и активно манипулировали этими факторами. Пришлось искать новые способы, и машинное обучение постепенно начало становиться основным. Однако нейросети нужно обучать. Для этого нужно вырабатывать набор метрик с весом для каждой, а также формулу для расчета “качества” по этим метрикам. Попытка работать с кликабельностью приводила к стабилизации поисковой выдачи, когда новые страницы просто не могли пробиться в топ. В итоге это приводило к тем же последствиям, к которым ведет монополизация в обычной жизни. И т.д. В первой статье по ссылке разработчики описывают то, как обучалась нейросеть и чему в итоге научилась. Вторая же статья нужна для понимания разницы в подходах и методике обучения. Технология эффективного поиска информации – это не просто описание метрик текстового поиска по ключевым словам. Это еще и философия, заложенная в методику. Жаль, что об этом мало кто пишет – надеюсь, моя небольшая статья немного исправит эту ситуацию.

Так вот, базовый уровень – точное соответствие запроса заголовку, нейросеть применила как метод самым первым. Именно поэтому он и называется базовым уровнем – в жизни это самый частый и самый популярный (в смысле – используемый, известный и повторяющийся) способ распознавания “релевантности” реальности, чего-то, что соответствует вашим сформированным ожиданиям. SEO в этом плане – лишь одна небольшая ниша, в которой это правило действует.

Но разработчикам такое ноу-хау от нейросети не очень-то было и нужно – точное соответствие как основной метод поиска и без нейросетей успешно работает. Ничего нового, в общем. Поэтому в итоге они придумали следующую схему улучшения и развития поиска (описываю своими словами упрощенно и популярно)).

  • Была сотня случайных заголовков.
  • Нейросеть была тупенькой.
  • Когда ты дурак, выбор лучшего результата невозможен, т.к. нет ключа или отмычки для сравнения и выбора. (Поминаем всуе эффект Даннинга-Крюгера).
  • Нейросеть выбирала результат из этих случайных вариантов, “называла” его лучшим.
  • Теперь внимание.
  • Разработчики брали этот результат и – называли его худшим!
  • Собирали набор таких “худших” лучших результатов и отдавали обратно на анализ.
  • Таким образом, нейросеть начала по сути “анализировать ошибки”, не учитывая предыдущие достижения.
Еще по теме  Точное соответствие как проблема и опасность развития искусственного интеллекта

Если бы такое провернули с человеком, это была бы абсолютно негативная мотивация с конечным “белым билетом” и гордым званием шизофреника. Т.к. любое твое достижение, завершенный дофаминовый цикл, по сути обесценивается и тебе предлагают начать поиск сначала. И без остановки по кругу.

Разработчики этот методический подход описали следующими словами: “Многие очевидные решения становятся очевидны только после их обнаружения. Так получилось и на этот раз: спустя некоторое время обнаружилось, что лучший способ генерации отрицательных примеров — это заставить сеть «воевать» против самой себя, учиться на собственных ошибках.”

Учиться на ошибках? Но разве это оно?!

Предположим, выбираете вы машину. Выбрали. Купили. Супер! Через минуту приходит человек и отбирает у вас машину, называя ваши действия худшими из возможных. Ошибка! И подкидывает вам другие варианты для выбора. Обрадуетесь? Предположим, оценили ошибку, задумались, начали выбирать. Выбрали новый вариант машины. Купили. Супер! Через минуту приходит человек и отбирает ваш новый вариант, подкидывая еще десяток. И отказаться вы не можете. Снова обрадуетесь?

Ладно, еще более простой пример. 10 третьеклассников решают контрольную по математике – читают текст 10 задач, затем выбирают случайным образом из 10 000 вариантов те 10 (0,1%), которые кажутся им подходящими. Им так сказали – выбирать случайно то, что им кажется подходящим. Решают, сдают на проверку. В чем загвоздка, по-моему, уже очевидно? Нет? Ладно, продолжаем. Учитель хвалит каждого за решение, проверяет ответы (или делает вид, что проверяет), и говорит: всем по 2 балла, делайте контрольную еще раз, но теперь у вас есть только 100 ранее выбранных вами вариантов (которые были лучшими, но на самом деле неудачные) – вы можете выбрать только из них. Дети повторяют цикл, снова выбирают – и снова получают по 2 балла. И так по кругу тысячи и тысячи раз… Шиза, правда? А проблема в том, что случайность как фактор ранжирования в такой методике по сути становится ключевой.

В реальной жизни с таким “обучением” с каждым разом раздражение и чувство безысходности будет расти. Это ведь обман в чистом виде. Невозможно выбирать случайные результаты, выдавая их за решение. Подкрепление в жизни происходит от достигнутого результата, который ОЦЕНИВАЕТСЯ ПОЛЬЗОВАТЕЛЕМ В МОМЕНТ ДОСТИЖЕНИЯ. Даже если он не самый лучший для пользователя. Грубо говоря, кто-то даже стоя на обрыве за миг до падения может думать, что добился того, чего хотел. А потом упасть и завершить поисковую сессию окончательно.

Еще по теме  SEO стратегия. Кейс о том, как в процессе seo-аудита могут поменяться цели оптимизации

Однако, если создавать ПРИВЫЧКУ ОТРИЦАНИЯ ДОСТИГНУТОГО РЕЗУЛЬТАТА как положительного, никакого обучения с положительными результатами не будет происходить. Будет происходить избегание поисковой активности и депривация. Все пофиг станет, проще говоря. Потому что зачем что-то делать, если в большинстве случаев мой лучший выбор на самом деле – мой худший выбор? Такое возможно только в одном случае: при отсутствии памяти на происходившие события. То есть при отсутствии истории выбора и уточнения данных по этой истории. Жизнь бабочки-однодневки такая получается или больного Альцгеймером с разрушенными нейромедиаторными сетями.

Разработчики же писали следующее: “Раз за разом повторяя данную процедуру, мы видели, как заметно улучшается качество модели, и всё чаще лучшие из случайных пар становились ПОХОЖИ НА НАСТОЯЩИЕ положительные примеры. Проблема была решена.”

Понимаете теперь, в чем проблема разработчиков поисковых технологий будущего? Не только в том, что они пытаются использовать негативное подкрепление в своих моделях. Оно как бы работает и дает результаты. Это ужасно как метод, но это все равно не главное.

Главное в том, что они создают СИМУЛЯЦИИ, основанные на негативном подкреплении. И до сих пор не понимают реальных механизмов поискового поведения. Они говорят, что им все равно, за счет чего достигается “релевантность” поиска – главное, чтобы она достигалась? Что ж, может оно и к лучшему. Здесь риск один: симулякры начинают все больше влиять на нашу жизнь, создавая видимость ВСЕГО и подменяя рациональные контекстные модели ОСОЗНАННОГО решения – псевдо-универсальными статистическими моделями случайного выбора. В жизни это приводит не только к показу “подходящих результатов”, но также к таким явлениям, как сегрегация, выбор большинства, отрицание возможности влияния малого на большое, и т.д. К росту и фиксации ментальных моделей, которые по сути тормозят развитие.

В биологии и теории эволюции – это пример противопоставления Ламарка и Дарвина. При этом, изучая первого и второго с современным набором знаний, вы очень быстро поймете, что ошибались оба, и правы были частично оба! Ну прям как в случае с нейросетями и выбором случайных взаимосвязей, которые стабилизировались и выдавались за не-случайные…

“Что же изменил Дарвин в теории Ламарка? Он отказался от второй посылки своего предшественника — «тяги к совершенству» — и придумал такой механизм эволюционных изменений, которого теория Ламарка не предусматривала, — естественный отбор. ” Цитата из второй статьи по ссылке выше.

Понимаете, Дарвин тоже выступал за “последовательное развитие” признаков, отказавшись от возможности “осознанного” выбора этих признаков их носителем. Механизм естественного отбора Дарвина основан на борьбе за существование, изменчивости и наследственности. Дарвин, как и Ламарк, не отрицал идею наследования приобретенных признаков – наоборот! Просто больше сотни лет об этом предпочитают умалчивать, т.к. “что-то не так” получалось с таким подходом, “ненаучно” и все такое. И только совсем недавно была открыта эпигенетика как возможность передачи по наследству приобретенных признаков! Но даже в рамках эпигенетики все еще ОТРИЦАЕТСЯ возможность осознанного конкретным пользователем “включения” и “развития” того или иного СВОЙСТВА. И вот что пишут теперь в научных статьях про поисковые технологии [прошлого] клеток:

“Это открытие показало, что у клеток есть возможность целенаправленно, почти «сознательно», изменять собственный геном. Конечно, сделать процесс поиска подходящего варианта по-настоящему осознанным клеткам так и не удалось. Они не могут исследовать новый вирус и сразу определить, какой именно белок в данном случае нужен. Им приходится действовать методом «оптимизированного случайного поиска». Оптимизированного — поскольку имеются универсальные заготовки, а клетки «знают», в какие участки этих заготовок следует вносить случайные изменения. Но ведь и это уже немало! Между тем самое интересное еще впереди. Недавно группа австралийских иммунологов собрала убедительные данные, показывающие, что изменения, приобретенные генами иммунных белков в течение жизни организма, иногда могут передаваться по наследству.” // Почитайте о цепочке событий и как все развивалось в противопоставлении Ламарка и Дарвина, хорошая популярная статья “От Ламарка к Дарвину… и обратно” на “Элементах”, там реально интересно.

Для меня же в рамках моей статьи вывод главный один: симулякры не только подменяют РЕАЛЬНОСТЬ, но и отбирают время вашей жизни. Пример “научных” споров в деле Ламарка-Дарвина показателен (а на самом деле псевдо-научных, т.к. это были не споры, а средства поражения несогласных – ярлыки, манипуляции, обощения, подмена категорий хвостами, и и тп, замылившие вопрос и законсервировавшие развитие на долгие годы). И ведь цикл еще не завершен! А что будет, когда стабилизируются “технологические” симулякры, сформированные с помощью поисковых машин и нейросетей как их обслуживающего персонала?

Еще по теме  PR сайта или PR для сайта? Пиарим сайт по-нашему:)

Можно научиться чему-то и с помощью симулякров, не отрицаю, но сколько у вас есть на это времени? Некоторые поисковые сессии у людей могут длиться годами, а их закрытия не происходит даже со смертью физического тела. Что делать? Учиться самостоятельно правильно завершать поисковые сессии и продолжать их по своему желанию, применяя положительное подкрепление. Учиться наблюдать, искать ошибки и благодарить. Другой дороги нет :) Так происходит “взросление”, и когда разработчики поисковика поймут, что такое “взросление” на самом деле и что “готовые ответы” всегда были и будут всего лишь “готовыми ответами”, тогда может быть они и сами признают свою утилитарную роль, перестанут играть в новых богов и подминать под себя реальность?

Или вообще все не так и мне это лишь почудилось на экране монитора?..


Какая модель оплаты SEO услуг кажется вам более справедливой?

Результаты

Загрузка ... Загрузка ...