<НА ГЛАВНУЮ

AI Sheets: безкодовый табличный инструмент Hugging Face для создания наборов данных на базе LLM

'Hugging Face выпустила AI Sheets — бесплатный открытый инструмент в виде таблицы для создания, очистки и обогащения наборов данных с помощью open-source LLM, доступный в браузере и для локального запуска.'

Что такое AI Sheets?

Hugging Face представила AI Sheets — бесплатный, открытый и локально-ориентированный безкодовый инструмент, который объединяет привычный интерфейс таблиц со способностью работать с LLM для создания и обогащения наборов данных. Каждая колонка или ячейка может быть связана с моделью и управляться через обычные текстовые подсказки.

Основные возможности

  • Удобный интерфейс таблицы, где операции с данными выполняются через подсказки, без необходимости писать код.
  • Подключение тысяч моделей с Hugging Face Hub, а также поддержка локальных моделей и собственных релизов, совместимых с 'OpenAI API spec'.
  • Локальный запуск обеспечивает хранение данных на машине пользователя, что важно для безопасности и соблюдения требований конфиденциальности.
  • Поддержка совместной работы, валидации и масштабных пайплайнов для генерации и обогащения данных.

Как это работает

Создайте колонку и введите простую текстовую подсказку — модель заполнит или обогатит значения в ячейках по строкам. Для локального использования укажите переменные окружения, например MODEL_ENDPOINT_URL и MODEL_ENDPOINT_NAME, чтобы связать AI Sheets с локальным инференс-сервером (например, с Ollama и загруженной Llama 3). Поскольку инструмент совместим со спецификацией OpenAI API, можно подсоединять разные совместимые эндпойнты.

Сценарии применения

  • Обогащение данных: добавление меток, генерация парафразов, расширение коротких примеров.
  • Очистка и трансформация: нормализация текста, извлечение полей и массовое приведение форматов.
  • Аннотирование и проверка: совместная корректировка результатов моделей и улучшение качества подсказок.
  • Массовая генерация: создание синтетических примеров для обучения и тестирования.

Развёртывание и начало работы

Попробуйте AI Sheets в браузере через Hugging Face Spaces для быстрого теста. Для приватности и производительности клонируйте репозиторий с GitHub (huggingface/aisheets), настройте локальный эндпойнт инференса и запустите инструмент в своей инфраструктуре. В репозитории и блоге есть инструкции по настройке и примеры рабочих процессов.

Почему это важно

AI Sheets снижает технический барьер для подготовки продвинутых наборов данных, сочетая доступность табличного интерфейса с мощью open-source LLM. Это дает возможность специалистам по данным быстрее прототипировать решения, аналитикам автоматизировать рутинные задачи, а не‑техническим пользователям — участвовать в создании и проверке данных без программирования.

🇬🇧

Switch Language

Read this article in English

Switch to English