Знания
📚

Знания

Предоставьте искусственному интеллекту доступ к своим документам, и он найдет самое важное.

Знания — это файлы и коллекции, которые ваш ИИ может искать, читать и анализировать. Загружайте PDF-файлы, электронные таблицы, код или любые текстовые документы. Создавайте коллекции по проектам, командам или темам. Когда модели нужен ответ, она обращается к вашей базе знаний, а не гадает наугад.

В отличие от Заметок, которые встраивают полный контент в каждое сообщение, Knowledge использует функцию поиска (RAG) для поиска нужных фрагментов по запросу. Это делает его подходящим решением для больших наборов документов, в которых встраивание всего контента выходило бы за рамки контекстного окна.

Зачем нужны знания?

Ваши документы станут доступны для поиска с помощью искусственного интеллекта

Загрузите папку с договорами, техническими спецификациями или научными статьями. ИИ будет искать в них смысл, а не просто ключевые слова, и указывать, где он нашел ответ.

Два режима поиска для разных задач

Выберите фокусированный поиск (RAG), чтобы ИИ мог эффективно искать в больших коллекциях, или полный контекст, чтобы дословно воспроизвести весь документ, если важна точность.

Автономный поиск с использованием встроенных функций

При включенном вызове нативной функции модели не просто выполняют поиск. Они просматривают ваши базы знаний, читают файлы постранично и синтезируют информацию из нескольких документов без необходимости ручного вмешательства.

Ограниченный доступ позволяет поддерживать порядок

Прикрепите к модели конкретные базы знаний, чтобы она выполняла поиск только по релевантным данным. Или не ограничивайте область поиска, чтобы модель находила все, к чему у пользователя есть доступ.

Ключевые особенности

📄 9 векторных баз данныхChromaDB и PGVector (официально поддерживаются), а также решения от сообщества: Qdrant, Milvus, OpenSearch, Elasticsearch и другие
🔍 Гибридный поискПоиск по ключевым словам BM25 + векторный поиск с переранжировкой с помощью кросс-кодировщика
📑 5 двигателей для экстракцииTika, Docling, Azure, Mistral OCR, пользовательские загрузчики
🤖 Агентное извлечениеМодели самостоятельно просматривают, ищут и читают ваши документы
📄 Режим полного контекстаВнедрение целых документов без разбивки на части
📦 Экспорт и APIСоздавайте резервные копии баз знаний в виде zip-файлов и управляйте ими с помощью REST API

Режимы поиска

При прикреплении файлов или баз знаний к модели нажмите на прикрепленный элемент, чтобы переключиться между режимами:

🔍 Сфокусированный поиск (по умолчанию)

Использует RAG для поиска и внедрения наиболее релевантных фрагментов на основе запроса пользователя. При включенном гибридном поиске (ENABLE_RAG_HYBRID_SEARCH поиск по ключевым словам BM25 сочетается с векторным поиском и переранжированием для повышения точности).

Лучше всего подходит для больших наборов документов, в которых важны только определенные разделы.

📄 Полный контекст

Вставляет полное содержимое файла в каждое сообщение. Без разбивки на фрагменты, без семантического поиска. Вставляется всегда, независимо от настроек вызова нативных функций, поэтому модели не нужно обращаться к каким-либо инструментам для доступа к файлу.

Лучше всего подходит для кратких справочных документов, руководств по стилю или контексту, который всегда актуален.

Инструменты Агентских Знаний

При включенном вызове нативной функции модели взаимодействуют с вашими базами знаний с помощью встроенных инструментов. Какие инструменты будут доступны, зависит от того, какие знания прикреплены к модели.

ИнструментПрикрепленный КБНе прикреплено ни одного КБОписание
list_knowledgeСписок всех КБ, файлов и примечаний, прикрепленных к модели
list_knowledge_basesПросмотрите доступные базы знаний с указанием количества файлов
search_knowledge_basesПоиск баз знаний по названию или описанию
query_knowledge_basesПоиск названий/описаний в базе знаний по семантическому сходству
search_knowledge_files✅ (ограниченный объем)✅ (все)Поиск файлов по имени файла
query_knowledge_files✅ (ограниченный объем)Поиск содержимого файла с помощью конвейера RAG
view_fileЧтение содержимого файла с разбивкой на страницы (по умолчанию 10 000 символов, максимум 100 000)
view_knowledge_fileЧтение содержимого файла из любого доступного хранилища
view_noteПрочитайте прилагаемые заметки

Разделение ключей: list_knowledge и list_knowledge_bases являются взаимоисключающими. Привязка к базе знаний ограничивает модель только теми документами, к которым у пользователя есть доступ. Если не привязывать модель к базе знаний, она будет учитывать все документы, к которым у пользователя есть доступ.

Автономное исследование лучше всего работает с передовыми моделями, которые могут разумно выполнять поиск по цепочке, просматривать и синтезировать. Модели меньшего размера могут испытывать трудности с многоступенчатым поиском. Администраторы могут отключить категорию инструментов для каждой модели в Базе знаний в Workspace > Models > Edit > Builtin Tools.


Знания НЕ внедряются автоматически при вызове нативной функции

Если включен вызов собственных функций, прикрепленные знания не внедряются автоматически. Модель должна вызывать инструменты для поиска и извлечения знаний. Если ваша модель не использует прикрепленные знания:

  1. Добавьте системные подсказки, указывающие модели на необходимость использования list_knowledge и query_knowledge_files.
  2. Отключите вызов собственных функций для этой модели, чтобы восстановить автоматическое внедрение RAG.
  3. Переключитесь в режим полного контекста, чтобы полностью обойти RAG.

Создание базы знаний

  1. Щелкните Рабочее пространство на боковой панели, затем выберите Знания.
  2. Нажмите + Новые знания и дайте им название и описание.
  3. Загружайте файлы или добавляйте существующие документы.
  4. Прикрепите базу знаний к модели в Рабочая область> Модели> Редактировать или обратитесь к ней в чате с #.

Экспорт

Администраторы могут экспортировать всю базу знаний в виде zip-файла с помощью пункта меню (три точки) > Экспорт. Файлы конвертируются в .txt для универсальной совместимости. Обычные пользователи не увидят опцию Экспорта.

Доступ к API

Базами знаний можно управлять программно:

  • POST /api/v1/files/ - Загрузить файлы
  • GET /api/v1/files/{id}/process/status - Проверить статус обработки
  • POST /api/v1/knowledge/{id}/file/add - Добавить файлы в базу знаний

Обработка файлов происходит асинхронно. Прежде чем добавлять файлы в базу знаний, необходимо дождаться завершения обработки, опрашивая конечную точку статуса, иначе вы получите сообщение об ошибке «пустое содержимое». 

Варианты использования

Документация по проекту

Загрузите технические характеристики, документацию по архитектуре и руководства по эксплуатации вашей команды в базу знаний. Прикрепите их к модели «Помощник по проекту». ИИ будет отвечать на вопросы, опираясь на вашу документацию, а не на общие обучающие данные.

Проверка на соответствие правовым нормам и требованиям

Загрузите договоры, политики и нормативные документы. Попросите ИИ найти конкретные пункты, сравнить условия в разных соглашениях или указать на несоответствия.

Обобщение результатов исследования

Добавьте десятки статей в базу знаний. ИИ будет искать в них ответы на вопросы, подтверждающие доказательства или выявляющие противоречия между исследованиями.

Ограничения

Контекстное окно в режиме полного контекста

При выборе параметра «Использовать весь документ» отображается весь текст. Большой документ, прикрепленный к модели с небольшим контекстным окном, будет перекрывать историю переписки.

Задержка при загрузке через API

Файлы, загружаемые через API, обрабатываются асинхронно. Попытка использовать файл до завершения обработки приведет к ошибке или вернет пустые результаты.

Вызов встроенной функции приводит к изменению поведения

Включение вызова собственных функций меняет принцип работы баз знаний. Если ваша база знаний внезапно перестала выдавать результаты, проверьте, не было ли function_calling: native задано в глобальных настройках модели по умолчанию.