«Офлайн-мозг» на Android: кастомный Agent Skill под Gemma 4 и Google AI Edge Gallery

Свежий разбор на Dev.to связывает анонсы Google I/O 2026 с практикой Agent Skills в Google AI Edge Gallery: там показан путь от идеи локального «второго мозга» до импортируемого пакета навыка, который работает на устройстве вместе с Gemma 4 и связкой LiteRT-LM, не отправляя личные заметки на сервер. Ниже — сжатое изложение для тех, кто следит за edge-инференсом, агентскими навыками и тем, как к этому стеку подводит мобильная линия Google.
Почему на I/O 2026 снова говорят про edge и Agent Skills
Автор завязывает сюжет на участие в Google I/O Writing Challenge и на ощущение, что в тени крупных облачных историй про Gemini для мобильных разработчиков заметнее стала линия Gallery на устройстве и поддержка Agent Skills. В такой подаче это выглядит как сдвиг к сценариям, где модель и оркестрация инструментов живут рядом с приложением, а не только в облаке. Если смотреть на AI-assisted development и on-device inference, удобная рамка — не абстрактный «ИИ в телефоне», а конкретный контур Edge Gallery + навыки агента.
Что за «Offline Brain» и как устроен манифест
Навык назван Offline Brain: в описании это кастомный on-device Agent Skill для локального сохранения и поиска личных заметок, с акцентом на то, что содержимое не уходит наружу. Для структуры пакета приводится пример JSON-манифеста offline-brain.json с полями вроде идентификатора, версии, текста описания, списка permissions (storage.read_local, storage.write_local) и инструментов save_note и search_notes с параметрами — всё это подано как иллюстративный листинг из исходного поста, а не как официальная спецификация Google. Отдельно проводится параллель с открытым стандартом, близким к Model Context Protocol (MCP), с оговоркой, что реализация заточена под mobile sandbox execution: тот же класс задач, что у MCP-совместимых агентов — описание инструментов и вызовы модели — но в мобильной «песочнице».
Слой логики на JavaScript и путь до .skill
Локальную логику показывают через JavaScript в среде V8: в примере кода фигурируют функции save_note / search_notes и работа с SandboxFS (запись списка файлов, чтение). Дальше речь идёт об упаковке JSON и JS в архив с расширением .skill (в тексте исходника — offline-brain.skill). Такой шаг читается как мост между описанием агента на бумаге и тем, что реально ставят на телефон: один файл, который затем подхватывает среда навыков.
Модель, размер и аргумент в пользу Gemma 4
В связке с LiteRT-LM фигурирует модель Gemma-4-E2B-it и упомянуто окно контекста 32K для on-device-сценария. Указан размер скачанной модели — 2,6 ГБ внутри Edge Gallery и подчёркивается, что для Agent Skills нужна именно вариация Gemma 4, тогда как для Gemma 3 «не хватает» tool-calling fine-tunes — это формулировка уровня мнения из первичного материала, а не независимый бенчмарк. Для аудитории про локальный inference полезный вывод прямой: выбор веса и семейства модели завязан на требования к вызову инструментов, без которого сценарий навыка не держится.
Импорт в Google AI Edge Gallery и проверка в чате
UI-цепочку описывают через вкладку Agent Skills, плавающую кнопку (FAB), пункт «Import Local Skill», выбор .skill файла и появление переключателя у навыка — то есть сценарий ручного сайдлоада кастомного skill в оболочке Gallery, а не абстрактный деплой «куда-то в облако». Финальный блок иллюстрируют диалогом с моделью: сначала сохраняют заметку про архитектуру React Native с отдельным слоем API и Zustand, затем идут заведомо нерелевантные запросы, после чего просят восстановить содержание заметки — как демонстрацию вызова search_notes и удержания контекста. Отдельно выделяется роль 32K как технического шага, который делает длинные edge-сессии менее хрупкими. Для того, кто собирает промпты, инструменты и политику памяти вокруг одного агента, это читается как мини-рецепт проверки: важно не только «ответила ли модель», а сработала ли связка навык + локальное хранилище + длинный контекст.
Источники
- parulmalhotraiitk. Building 'Offline Brain': How I Wrote My First Custom Agent Skill for Android (Google I/O 2026) 📱🧠 — Dev.to. URL: Dev.to — дата обращения: 2026-05-21T21:04:10Z (UTC).