Интеграция Luxms BI и PolyAnalyst для анализа текстовых данных

Информации, в том числе текстовой, с каждым годом становится все больше, и ее глубокий анализ имеет практическое значение для самых разных компаний. Это отражается на повышении качества обслуживания, развитии внутренних коммуникаций, оперативном реагировании на обратную связь и других аспектах деятельности компании.

В рамках интеграции Luxms BI и PolyAnalyst было реализовано совместное решение, которое совмещает алгоритмы текстовой аналитики PolyAnalyst и функционал аналитической платформы Luxms BI в части визуализации результатов текстового анализа.


Система PolyAnalyst подготавливает и обрабатывает данные для дальнейшего анализа и исследования - решение позволяется работать с текстовыми данными на 16 языках – 11 европейских и 5 азиатских.

Этапы текстового анализа

1. Один из этапов подготовки и обработки информации – извлечение сущностей и фактов, то есть фактически слов, которые подходят под определенные группы.

Например, обслуживание – это не только упоминание самого слова «обслуживание», но и других сущностей - «скорость», «очередь», «работа сотрудников» и т.д.

Что важно, система может извлекать не только стандартные, заранее запрограммированные, сущности, но и пользовательские - для конкретных компаний и направлений деятельности.

Например, для фармацевтики – «лекарственные препараты», для страховой компании – «инциденты» и «страховые случаи».

2. После выявления сущностей и фактов, можно переходить к одному из самых интересных этапов – анализу тональности текста.

Анализ тональности помогает понять эмоциональную составляющую, передаваемую фрагментом текста, например, чтобы определить, довольны ли клиенты обслуживанием в компании, своими покупками или оказанными услугами. 

Анализ тональности помогает заметить новые тенденции, отследить изменения настроений и решить проблемы продвижения продукции. Также благодаря анализу тональности можно отследить изменения в мнении клиентов и выявить первопричину различных проблем.

Визуализация данных для анализа

Вариантов визуализации информации, полученной из анализа текстов, большое количество: можно отфильтровать по городам или регионам, расположить иерархически, увидеть взаимосвязи. Рассмотрим несколько примеров.
k9c06nu20k0eacfehhq56o75ihq1tyef

Визуализация тональности по категориям

(Sentiment Analysis by Category)

Самый простой способ представить полученные данные – создать классический график, в котором наглядно видно количество негативных и позитивных упоминаний конкретных слов – сущностей.

Например, на изображении представлена группированная столбчатая диаграмма, отображающая распределение положительных и негативных упоминаний по ключевым темам.

Даже при беглом взгляде можно понять основные проблемные места и волнующие людей запросы:

  • красный цвет сигнализирует о негативном окрасе сущности,
  • а зеленый – о позитивном.
Классический график текстовой аналитики

Линейный график динамики тональности

(Sentiment Trend Line Chart)

Также есть возможность проследить динамику изменения тональностей по годам, месяцам и любым другим периодам. Это позволяет посмотреть на изменение тональностей, проследить тенденции и тренды.

Такой график — отличный инструмент для отслеживания репутации бренда или компании во времени, выявления:

  • Периодов кризисов или резкого роста недовольства.

  • Эффекта от запущенных инициатив (например, улучшение сервиса или запуск новой платформы).

  • Общих тенденций в восприятии клиентов.

Например, если негативная тональность уменьшается, значит, компания работает над улучшением обслуживания и реагирует на обратную связь клиентов.

Динамика

Визуализация ключевых тем и слов

(Key Topics and Keywords Visualization)

Для наглядного представления результатов анализа отзывов часто используют treemap и облако тегов:

  • Treemap показывает, какие темы и объекты обсуждаются чаще всего — например, «сотрудник», «карта» или «обслуживание». Каждый прямоугольник отражает отдельную тему. Его размер указывает на частотность, а цвет — на преобладающую тональность (положительную или отрицательную).

  • Облако тегов также визуализирует частотность и тональность слов. Чем чаще слово встречается в текстах, тем крупнее оно отображается. Цвет слова отражает его общую тональность: красный — если преобладает негатив, зелёный — если преобладает позитив.

Такие визуализации помогают быстро понять, какие темы волнуют пользователей, как они оценивают отдельные аспекты, и где есть точки для улучшения.

Облако тегов

Кому и зачем нужен текстовый анализ

Одно из направлений использования текстового анализа – массовый анализ и детальный разбор отзывов любых клиентов как из открытых, так из закрытых источников.


Если компания крупная, то отзывов может быть десятки тысяч, и автоматизированное решение для подробного анализа и последующей визуализации облегчает эту работу. Это приводит к повышению качества работы и обслуживания клиентов, и как следствие - к росту и развитию компании.


Еще одно направление, где востребована текстовая аналитика - использование решения для оценки различных технических аспектов: оценки логов, горячих линий, служб технической поддержки и служб поддержки клиентов. Не эмоциональные отзывы о качестве обслуживания или отношении к клиентам, а разбор технических замечаний. Это важно для того, чтобы понять основные тренды и направления развития - что клиенты хотят и чего ждут.


Еще один формат использования текстовой аналитики – работа с сотрудниками.  Пожелания и обратная связь, предложения и различные инициативы - возможность эту информацию автоматизированно обрабатывать и анализировать помогает понимать основные тренды и направления развития. Это особенно востребовано среди крупных клиентов с десятками тысяч сотрудников.

Форматов использования текстовой аналитики большое количество – она применима в компаниях любых направлений и масштабов, позволяет извлекать полезные сведения и принимать решение на их основе. А Luxms BI поможет с обработкой и визуализаций данных для принятия верных решений.