Обучение ChatGPT без лишних персональных данных: фильтр и Temporary Chat

30-дневное хранение Temporary Chat для модерации безопасности и очистка персональных полей через Privacy Filter до стадии обучения легли в основу гида OpenAI по ChatGPT от 6 мая 2026 года: фильтр прогоняют на разных этапах пайплайна по открытым наборам и по пользовательским чатам, если включено улучшение модели для всех.
Откуда берутся данные для обучения
В пайплайн попадают открытый веб, партнёрские источники и контент от пользователей, подрядчиков и исследователей — так базовые модели держат общие факты и безопасность ответов. Публичный контент берут только при свободной доступности без платной стены: пост на открытом форуме или блог может войти в корпус для обучения.
Privacy Filter в пайплайне
Отдельная сборка Privacy Filter доступна на Hugging Face бесплатно — если нужен тот же класс маскировки в своих пайплайнах.
Что настроить в интерфейсе
- В Settings → Data Controls выключить Improve the model for everyone — новые чаты остаются в истории, но не уходят на дообучение.
- Temporary Chat не пишет память, не виден в истории и не участвует в тренировке; для модерации диалоги хранятся 30 дней.
- Memory опциональна: её можно просматривать, править, удалять или полностью отключить.
Модель заточена отказывать в запросах приватных данных о людях; при ошибках заявку можно отправить через портал приватности. Чувствительные сведения лучше не класть в промпт, если не готовы к ревью и обработке по политике сервиса.
Источник: How ChatGPT learns about the world while protecting privacy.