BAUM AI – от выявления центров притяжения научного внимания и векторов развития к выбору технологий-трендсеттеров завтрашнего дня.
BAUM AI – от выявления центров притяжения научного внимания и векторов развития к выбору технологий-трендсеттеров завтрашнего дня.
В современном мире компании, которые занимаются разработкой инновационных промышленных изделий, должны эффективно планировать проведение НИОКР. Необходимо держать руку на пульсе рынка, понимать, кто лидер исследований сейчас и кто- на перспективу, какие новые технологии применимы, а какие- останутся на бумаге.
Для этого широкому кругу отраслевых специалистов (технологам, конструкторам, исследователям, топ-менеджерам, аналитикам) необходим инструмент, по сути позволяющий заглянуть в будущее технологий.
Нашей командой была предложена система анализа научных публикаций – реферативные данные Scopus custom data. Она помогает выявить центры притяжения научного внимания в той или иной отрасли.
Система на входе принимает массив неструктурированных реферативных данных, которые проходят препроцессинг и приводятся к структурированному виду. Современные алгоритмы обработки текстовых данных для решения задач NLP извлекают из каждого реферата от 6 до 10 ключевых слов и выполняют суммаризацию (сокращение размера текста).
Это позволяет определить основной смысл научной публикации. Далее данные группируются по полученным признакам, выявляя устойчивые кластеры. Центры кластеров определяют ключевые слова – области максимального интереса.
Не останавливаясь на достигнутом, наши специалисты разработали аналогичную систему кластеризации и предиктивного анализа патентной базы. Это решение выявляет тренды среди патентов и содержит встроенные инструменты продвинутого анализа результатов. Отметим, что поддерживаются базы патентов на русском, английском и китайском языках.