Обучение ChatGPT без лишних персональных данных: фильтр и Temporary Chat

30-дневное хранение Temporary Chat для модерации безопасности и очистка персональных полей через Privacy Filter до стадии обучения легли в основу гида OpenAI по ChatGPT от 6 мая 2026 года: фильтр прогоняют на разных этапах пайплайна по открытым наборам и по пользовательским чатам, если включено улучшение модели для всех.

Откуда берутся данные для обучения

В пайплайн попадают открытый веб, партнёрские источники и контент от пользователей, подрядчиков и исследователей — так базовые модели держат общие факты и безопасность ответов. Публичный контент берут только при свободной доступности без платной стены: пост на открытом форуме или блог может войти в корпус для обучения.

Privacy Filter в пайплайне

Отдельная сборка Privacy Filter доступна на Hugging Face бесплатно — если нужен тот же класс маскировки в своих пайплайнах.

Что настроить в интерфейсе

В Settings → Data Controls выключить Improve the model for everyone — новые чаты остаются в истории, но не уходят на дообучение.
Temporary Chat не пишет память, не виден в истории и не участвует в тренировке; для модерации диалоги хранятся 30 дней.
Memory опциональна: её можно просматривать, править, удалять или полностью отключить.

Модель заточена отказывать в запросах приватных данных о людях; при ошибках заявку можно отправить через портал приватности. Чувствительные сведения лучше не класть в промпт, если не готовы к ревью и обработке по политике сервиса.

Источник: How ChatGPT learns about the world while protecting privacy.