AI Vibe News — новости vibe coding, Cursor, Claude и MCP

Пять LLM против adversarial eval: лучший результат — 62,5%.
Разборы

Пять LLM против adversarial eval: лучший результат — 62,5%

Пять LLM через Groq API прошли adversarial eval агентского цикла с mock-инструментами — ни одна не набрала больше 63%, лидер Llama 3.3 70B остановился на 62,5%. отчёт автора на Dev.to Для…

Редакция8 июня 2026

Источник:Dev.to

VP обещал, что ИИ протестирует код сам: разбор кейса про AI-assisted QA.
Разборы

VP обещал, что ИИ протестирует код сам: разбор кейса про AI-assisted QA

Обязательный стандарт «ИИ пишет код и сам его проверяет» заканчивается для одного инженера переводом в legacy-команду без write-доступа — на фоне третьего дня полного cutover и $2,8M несогласованного…

Редакция8 июня 2026

Источник:Dev.to

Схема распределения возможностей ИИ между людьми, компаниями и институтами вместо концентрации у немногих игроков.
Новости

Третья фаза OpenAI: персональный AGI и автоматизированный исследователь к 2028

К марту 2028 года значительная доля внутренних исследований OpenAI может выполняться ИИ-системами в паре с людьми — 8 июня 2026 компания задала третью фазу и три главные цели на пути к AGI, который…

Редакция8 июня 2026

Источник:Built to benefit everyone: our plan

Экономисты на встрече разбирают данные об использовании ИИ и их влияние на рынок труда и производительность.
Новости

OpenAI запустила Economic Research Exchange для исследований влияния ИИ

8 июня 2026 года OpenAI запустила Economic Research Exchange — платформу, где внешние исследователи смогут разбирать, как искусственный интеллект меняет занятость, производительность команд и…

Редакция8 июня 2026

Источник:Introducing the OpenAI Economic Research Exchange

Семь AI-приложений и семь библиотек за год: как студент совмещает учёбу и отгрузку продуктов.
Разборы

Семь AI-приложений и семь библиотек за год: как студент совмещает учёбу и отгрузку продуктов

Студент третьего курса IITRAM в Ахмадабаде за год вывел в продакшен семь AI-приложений и семь open-source библиотек — при полной очной учёбе, без команды и финансирования. В разборе на Dev.to…

Редакция7 июня 2026

Источник:Dev.to

ИИ-компании платят миллионы за старые посты Reddit — и это касается каждого, кто пишет код. Разработчик nimay_04 на Dev.
Разборы

ИИ-компании платят миллионы за старые посты Reddit — и это касается каждого, кто пишет код

Разработчик nimay_04 на Dev.to связывает две линии одной проблемы: усталость от однотипных AI-generated dashboard в code editor и сделки ведущих ИИ-компаний за архивные посты Reddit. разбор…

Редакция7 июня 2026

Источник:Dev.to

ClassifierAI: Chrome-расширение с Copilot, которое ищет AI-контент на DEV. На Dev.
Разборы

ClassifierAI: Chrome-расширение с Copilot, которое ищет AI-контент на DEV

На Dev.to разгорается спор об AI-статьях — и команда The DEVengers отвечает инструментом: прототип ClassifierAI сканирует обложку и текст публикации на платформе и выдаёт метку «человек / смешанный /…

Редакция6 июня 2026

Источник:Dev.to

Dev Opportunity Radar #2: резиденция, AI-исследования и хакатон на $60K.
Разборы

Dev Opportunity Radar #2: резиденция, AI-исследования и хакатон на $60K

Второй выпуск Dev Opportunity Radar — сжатая карта AI-возможностей для разработчиков: исследования, агентные прототипы, обучение. Автор hemapriya_kanagala в материале от 5 июня 2026 года сводит…

Редакция6 июня 2026

Источник:Dev.to

SDK-агент вызывает пользовательскую функцию через custom-user-tools, пока auto-review проверяет опасные tool calls в headless-режиме.
Новости

Cursor SDK: custom tools без своего MCP и auto-review для CI

В TypeScript- и Python-SDK Cursor добавили custom tools: функцию передаёте в local.customTools при Agent.create() или в отдельном send() , и модель вызывает её через встроенный MCP-сервер…

Редакция6 июня 2026

Источник:Custom stores, custom tools, and auto-review for the Cursor SDK · Cursor

Десктопный агент Claude Cowork связывает локальные файлы, Slack и Google Drive в цепочку до готового документа с цитатами на источники.
Новости

Claude Cowork: гайд Anthropic по агенту для доков, отчётов и Slack

5 июня 2026 года Anthropic выложила практический гайд по Claude Cowork — агенту knowledge work в десктопном приложении Claude. Вместо ответа в чате он читает и пишет локальные файлы, ходит в Slack и…

Редакция5 июня 2026

Источник:The Claude Cowork product guide | Claude