Знания
Предоставьте искусственному интеллекту доступ к своим документам, и он найдет самое важное.
Знания — это файлы и коллекции, которые ваш ИИ может искать, читать и анализировать. Загружайте PDF-файлы, электронные таблицы, код или любые текстовые документы. Создавайте коллекции по проектам, командам или темам. Когда модели нужен ответ, она обращается к вашей базе знаний, а не гадает наугад.
В отличие от Заметок, которые встраивают полный контент в каждое сообщение, Knowledge использует функцию поиска (RAG) для поиска нужных фрагментов по запросу. Это делает его подходящим решением для больших наборов документов, в которых встраивание всего контента выходило бы за рамки контекстного окна.
Зачем нужны знания?
Ваши документы станут доступны для поиска с помощью искусственного интеллекта
Загрузите папку с договорами, техническими спецификациями или научными статьями. ИИ будет искать в них смысл, а не просто ключевые слова, и указывать, где он нашел ответ.
Два режима поиска для разных задач
Выберите фокусированный поиск (RAG), чтобы ИИ мог эффективно искать в больших коллекциях, или полный контекст, чтобы дословно воспроизвести весь документ, если важна точность.
Автономный поиск с использованием встроенных функций
При включенном вызове нативной функции модели не просто выполняют поиск. Они просматривают ваши базы знаний, читают файлы постранично и синтезируют информацию из нескольких документов без необходимости ручного вмешательства.
Ограниченный доступ позволяет поддерживать порядок
Прикрепите к модели конкретные базы знаний, чтобы она выполняла поиск только по релевантным данным. Или не ограничивайте область поиска, чтобы модель находила все, к чему у пользователя есть доступ.
Ключевые особенности
| 📄 9 векторных баз данных | ChromaDB и PGVector (официально поддерживаются), а также решения от сообщества: Qdrant, Milvus, OpenSearch, Elasticsearch и другие |
| 🔍 Гибридный поиск | Поиск по ключевым словам BM25 + векторный поиск с переранжировкой с помощью кросс-кодировщика |
| 📑 5 двигателей для экстракции | Tika, Docling, Azure, Mistral OCR, пользовательские загрузчики |
| 🤖 Агентное извлечение | Модели самостоятельно просматривают, ищут и читают ваши документы |
| 📄 Режим полного контекста | Внедрение целых документов без разбивки на части |
| 📦 Экспорт и API | Создавайте резервные копии баз знаний в виде zip-файлов и управляйте ими с помощью REST API |
Режимы поиска
При прикреплении файлов или баз знаний к модели нажмите на прикрепленный элемент, чтобы переключиться между режимами:
🔍 Сфокусированный поиск (по умолчанию)
Использует RAG для поиска и внедрения наиболее релевантных фрагментов на основе запроса пользователя. При включенном гибридном поиске (ENABLE_RAG_HYBRID_SEARCH поиск по ключевым словам BM25 сочетается с векторным поиском и переранжированием для повышения точности).
Лучше всего подходит для больших наборов документов, в которых важны только определенные разделы.
📄 Полный контекст
Вставляет полное содержимое файла в каждое сообщение. Без разбивки на фрагменты, без семантического поиска. Вставляется всегда, независимо от настроек вызова нативных функций, поэтому модели не нужно обращаться к каким-либо инструментам для доступа к файлу.
Лучше всего подходит для кратких справочных документов, руководств по стилю или контексту, который всегда актуален.
Инструменты Агентских Знаний
При включенном вызове нативной функции модели взаимодействуют с вашими базами знаний с помощью встроенных инструментов. Какие инструменты будут доступны, зависит от того, какие знания прикреплены к модели.
| Инструмент | Прикрепленный КБ | Не прикреплено ни одного КБ | Описание |
|---|---|---|---|
| list_knowledge | ✅ | ❌ | Список всех КБ, файлов и примечаний, прикрепленных к модели |
| list_knowledge_bases | ❌ | ✅ | Просмотрите доступные базы знаний с указанием количества файлов |
| search_knowledge_bases | ❌ | ✅ | Поиск баз знаний по названию или описанию |
| query_knowledge_bases | ❌ | ✅ | Поиск названий/описаний в базе знаний по семантическому сходству |
| search_knowledge_files | ✅ (ограниченный объем) | ✅ (все) | Поиск файлов по имени файла |
| query_knowledge_files | ✅ (ограниченный объем) | ✅ | Поиск содержимого файла с помощью конвейера RAG |
| view_file | ✅ | ❌ | Чтение содержимого файла с разбивкой на страницы (по умолчанию 10 000 символов, максимум 100 000) |
| view_knowledge_file | ✅ | ✅ | Чтение содержимого файла из любого доступного хранилища |
| view_note | ✅ | ❌ | Прочитайте прилагаемые заметки |
Разделение ключей: list_knowledge и list_knowledge_bases являются взаимоисключающими. Привязка к базе знаний ограничивает модель только теми документами, к которым у пользователя есть доступ. Если не привязывать модель к базе знаний, она будет учитывать все документы, к которым у пользователя есть доступ.
Автономное исследование лучше всего работает с передовыми моделями, которые могут разумно выполнять поиск по цепочке, просматривать и синтезировать. Модели меньшего размера могут испытывать трудности с многоступенчатым поиском. Администраторы могут отключить категорию инструментов для каждой модели в Базе знаний в Workspace > Models > Edit > Builtin Tools.
Знания НЕ внедряются автоматически при вызове нативной функции
Если включен вызов собственных функций, прикрепленные знания не внедряются автоматически. Модель должна вызывать инструменты для поиска и извлечения знаний. Если ваша модель не использует прикрепленные знания:
- Добавьте системные подсказки, указывающие модели на необходимость использования list_knowledge и query_knowledge_files.
- Отключите вызов собственных функций для этой модели, чтобы восстановить автоматическое внедрение RAG.
- Переключитесь в режим полного контекста, чтобы полностью обойти RAG.
Создание базы знаний
- Щелкните Рабочее пространство на боковой панели, затем выберите Знания.
- Нажмите + Новые знания и дайте им название и описание.
- Загружайте файлы или добавляйте существующие документы.
- Прикрепите базу знаний к модели в Рабочая область> Модели> Редактировать или обратитесь к ней в чате с #.
Экспорт
Администраторы могут экспортировать всю базу знаний в виде zip-файла с помощью пункта меню (три точки) > Экспорт. Файлы конвертируются в .txt для универсальной совместимости. Обычные пользователи не увидят опцию Экспорта.
Доступ к API
Базами знаний можно управлять программно:
- POST /api/v1/files/ - Загрузить файлы
- GET /api/v1/files/{id}/process/status - Проверить статус обработки
- POST /api/v1/knowledge/{id}/file/add - Добавить файлы в базу знаний
Обработка файлов происходит асинхронно. Прежде чем добавлять файлы в базу знаний, необходимо дождаться завершения обработки, опрашивая конечную точку статуса, иначе вы получите сообщение об ошибке «пустое содержимое».
Варианты использования
Документация по проекту
Загрузите технические характеристики, документацию по архитектуре и руководства по эксплуатации вашей команды в базу знаний. Прикрепите их к модели «Помощник по проекту». ИИ будет отвечать на вопросы, опираясь на вашу документацию, а не на общие обучающие данные.
Проверка на соответствие правовым нормам и требованиям
Загрузите договоры, политики и нормативные документы. Попросите ИИ найти конкретные пункты, сравнить условия в разных соглашениях или указать на несоответствия.
Обобщение результатов исследования
Добавьте десятки статей в базу знаний. ИИ будет искать в них ответы на вопросы, подтверждающие доказательства или выявляющие противоречия между исследованиями.
Ограничения
Контекстное окно в режиме полного контекста
При выборе параметра «Использовать весь документ» отображается весь текст. Большой документ, прикрепленный к модели с небольшим контекстным окном, будет перекрывать историю переписки.
Задержка при загрузке через API
Файлы, загружаемые через API, обрабатываются асинхронно. Попытка использовать файл до завершения обработки приведет к ошибке или вернет пустые результаты.
Вызов встроенной функции приводит к изменению поведения
Включение вызова собственных функций меняет принцип работы баз знаний. Если ваша база знаний внезапно перестала выдавать результаты, проверьте, не было ли function_calling: native задано в глобальных настройках модели по умолчанию.