@kyrillic

Экономика фейковых звёзд на GitHub

Я неоднократно упоминал, что в последние 2-3 года происходит "инфляция гитхаб-звезд": их нужно все больше и больше, чтобы производить впечатление.

И это на удивление важный параметр для венчурных опенсорс-стартапов: по динамике звезд инвесторы частично определяют хайповость, а по форкам - востребованность. Эти метрики я видел много раз в питчах, в том числе на YC demo days. А инвесторы мониторят тренды гитхаба.

Оказывается, инфляция мне не привиделась: есть целый рынок накрутки звезд! Который гонит вверх ожидания от честных проектов. Детали:

1️⃣ Есть исследование (pdf) с анализом звезд гитхаба за 2019-24 гг: найдено 6 млн фейковых на 18+ тыс репозиториев.

До 2022 г фейки были в основном у скам-проектов, чтобы выглядеть более легитимно: всякий варез, фишинг, криптоботы и др. Но с 2022 г фейковый звезд стало намного больше, достигнув пика к 2024 (дальше к сожалению данных нет).

2️⃣ Каждый шестой (!) быстрорастущий проект имеет признаки накрутки звезд. Если убрать откровенный скам, то топ-1 категория с накрутками сегодня - AI/LLM проекты, они забрали первое место у блокчейн-проектов 🙂

3️⃣ Стоимость фейковой звезды - от 3 до 85 центов. Медианное число звезд на seed раунде - 2-3 тыс, на серии А - 5 тыс. Манипулировать недорого!

Рынок звезд работает совершенно открыто - все можно просто загуглить: десятки сайтов, Fiverr-гиги, тг-каналы, биржи взаимного обмена звёздами.

4️⃣ Есть премиум-сегмент: аккаунты с пятилетней историей коммитов и значком Arctic Code Vault Contributor продаются в тг примерно по $5k.

Накрутки распространились за пределы гитхаба: npm-загрузки надуваются через AWS Lambda (один чел довел пакет до 1 млн загрузок в неделю с 0 реальных юзеров), расширения VS Code - через ботов.

Есть риски у честных проектов: конкурент/недоброжелатель накрутит звезды, и потом доказывай, что не накручивал сам. Защиты от такой атаки не существует.

5️⃣ Топ-1 в одном из VC-рейтингов быстрорастущих опенсорс-стартапов (ROSS Index от Runa Capital) занял проект, у которого нашли ~47% подозрительных звёзд.

Bessemer (топовый фонд) уже давно называет звёзды vanity metrics и вместо них смотрит на уникальных контрибьюторов в месяц: кто создал issue, pr или коммит. Таких проектов, набирающих 250+ в месяц, меньше 5% от топ-10000 репозиториев.

6️⃣ Фейковые аккаунты почти неотличимы от реальных по профилю - аватар, био и др. Но 60%+ из них занимались исключительно звездвами.

На глазок накрутки можно определить по соотношению форков к звездам. Например 235 форков на 1000 звезд - это ок, а 20 форков на тысячу - слишком подозрительно. Если проект никто не форкает, его никто не использует.

Соотношение watchers-to-stars тоже работает. У одного из проанализированных репозиториев 157 тыс звёзд и 168 watchers. Один watcher на тысячу.

7️⃣ В США с окт'2024 действует правило FTC (Consumer Review Rule), прямо запрещающее покупку/продажу фейковых отзывов и показателей соцсетей. Штраф $53 тыс за одно нарушение. Пока применялось к отзывам, но гитхаб-звёзды формально попадают под ту же норму.

8️⃣ Сам гитхаб активно борется с накрутками, большинство фейк-аккаунтов забанены. Но рынок накрутки звезд все еще существует, их "инфляция" растет, и честным проектам все сложнее впечатлять своим ростом.

https://t.me/kyrillic/1991

#венчур #стартапы