Про качество текстового контента в интернете будущего
Многие переживают о нейрослопе, но мне кажется есть намного более серьезная проблема: в интернете будет в принципе меньше годного контента!
1️⃣ На любой платформе есть простой экономический закон: если контентмейкер может зарабатывать там деньги, то это мотивирует производить более качественный контент. А если площадка не позволяет зарабатывать, то там будет меньше годноты по определению.
Проще говоря, есть доход - есть контент.
2️⃣ Этот принцип можно переложить на весь интернет: раньше сайты делали контент, а гугл давал им трафик, и все зарабатывали на этом.
Но LLMs выдают ответ сразу, юзер чаще всего не переходит на сайт, соответсвенно не видит рекламы.
Грустный пример stackoverflow мы все знаем - там падение трафика шло с 2016-го, но резко ускорилось с выходом chatgpt, упал чуть ли не до нуля.

3️⃣ Все усугубляется тем, что LLM учатся во многом на тех текстах, которые были написаные благодаря возможности заработать на этом контенте.
То есть теперь у нас такой замкнутый круг:
LLM отнимают трафик (zero-click search) —> владельцы сайтов меньше зарабатывают —> производится меньше контента —> меньше возможностей обучать LLM.
4️⃣ Демо версию такой проблемы мы уже видели: некоторые мировые регуляторы и сми имели претензии к гуглу, за то что он показывал контент в выдаче или в снипптетах, без перехода на сайт. Из-за чего издания недополучали трафика. Но там конфликт был скорее об авторском праве, менее фундаментальный и сложный.
5️⃣ Модель "произвожу контент —> получаю seo-траф —> монетизирую" работала с 90-х, но в ближайшем будущем с таким подходом наверняка будет непросто.
Но куда пойдут усилия? Видеоконтент? Более авторский? Более брендовый в ответ на AI слоп?
Логично, что хороший, ценный контент будет чаще под пейволлом, как мы уже давно видим у крупных сми.
Насколько будет сложнее обучать модели, если хорошего человеческого контента скорее всего будет меньше?
6️⃣ А куда пойдет гугл, которому приходится внедрять AI в выдачу, но от этого страдают контентмейеры, с которыми у него был win-win 20+ лет?
В некотором смысле контент перестает быть продуктом, а становится сырьем для языковых моделей.
Короче говоря, много вопросов, мало ответов. Но точно есть возможности! И полезно научиться писать годный контент - на эту тему тут есть важные посты - раз, два!