Цифровая интуиция

Патент LT6685
*бери идею и делай лучше

Проблема

Люди часто пользуются интуицией. Но если интуиция не основана на опыте, то это приводит к ошибкам.

Решение

Цифровая интуиция — это коллективный опыт за продолжительный срок. Человека можно предупредить о том, что чаще всего случается при похожих обстоятельствах. Способ анализа данных отличается от человеческого восприятия. Результат анализа – это расширение когнитивных способностей человека.

Значимость

Мнение толпы опирается на небольшое количество новостей, о которых узнало большое количество людей. Управление – это технология, основанная на опыте. А если манипуляция общественным мнением не отличается оригинальностью, то алгоритм укажет на аномалию и сходство. Подозрение – это еще не обвинение. Но обнаружение шаблонов разрушает репутацию манипуляторов.

Проект Analytica.Today важен для конспирологов и антиконспирологов. Если обнаружится взаимосвязь между конфликтами и природными явлениями, значит, у кого-то есть такой инструмент шантажа. Это интересно, а внимание людей сегодня является ликвидным товаром. При большом объеме данных обнаружение интересных связей это лишь вопрос времени.

Технический анализ новостей

Для функционирования системы необходимо обработать большой архив исторических данных. На первом этапе я собираю данные за 20 лет, а моим инструментом является Excel. По материалам за первые 20 лет нового тысячелетия можно будет выпустить обзор в стиле "Намедни" Леонида Парфенова.

Главные события из новостной ленты я оцениваю по восьми признакам, в которых используется 124 оценки. Таким образом, я получаю материал для статистического анализа. Строятся графики объема данных и графики производных функций. Можно вычислить средние значения корреляций графиков и обнаруживать локальные аномалии. Для детального разбора, выбранное сообщение совмещается на шкале времени с аналогичными событиями и так по каждой категории. Оценивается корреляция графиков между совмещенными отрезками времени около похожих событий. Обнаруженные связи усиливаются путем исключения из графиков тех параметров, которые ослабляют связь. Многие зависимости легко объяснить, но обнаруживаются и необъясненные зависимости. Если новость подозрительно укладывается в выявленные ранее шаблоны последовательностей, то получаем предсказательную силу на математическом основании. Если сопоставление оказалось интересным, то это привлечет внимание, измеряемое в количестве просмотров. Внимание людей – это обратная связь для искусственного интеллекта, который станет искать эвристические комбинации автоматически.

Результатом является прогноз новостных сообщений. Это похоже на прогноз погоды, который становится более точным по мере усложнения алгоритмов.

Продукт

Я думаю, что программа для поиска шаблонов в различных массивах данных появится года через два. На домене Analytica.Team будет облачная версия. Также будет версия для работы без Интернета. Способы ввода данных и набор признаков будут адаптироваться для разных задач. Пользователи смогут создавать свои проекты или участвовать в уже начатых программах.

На платформе Analytica.Team можно будет нанимать аналитиков, а аналитики найдут заработок.

Посетители сайта Intuition.Digital смогут оценивать обнаруженные шаблоны и движением пальца по тачскрину давать оценки: "Ерунда", "Очевидно" и "Эврика". Чем больше оценок, тем интереснее результат работы искусственного интеллекта.

Рейтинговое агентство новостей Analytica.Today предложит новостным агентствам размещать маленький баннер возле публикуемых сообщений. Если сообщение набирает определенное количество просмотров, то на банере будет отображаться рейтинг шаблонности. Рейтинг шаблонности - это дополнительный материал для новостных агенств и мы предоставляем его бесплатно. Нажав на баннер, пользователь получает доступ к более подробной информации о шаблонах из прошлого.

Бизнес заключается в генерации информации об информации. Мы можем продавать рекламное место на сайте или подписку. Стоимость ручной обработки одного сообщения сегодня составляет 2 евро. Автоматизация обработки снизит эту стоимость в разы. Объем мирового медиарынка исчисляется триллионами. В периоды кризисов падает доверие к старым экспертам, а значимость цифровой интуиции будет расти.


Анализ последовательности сообщений

Предметом изобретения является технология выявления статистических связей в последовательности новостных, рекламных или иных сообщений. Поступающие сообщения классифицируются по нескольким признакам. Выборочная повторная классификация используется для учета различных трактовок оценки признака. Преобразованные в код сообщения формируют матрицу оценок. Для обнаружения шаблона в последовательности сообщений на шкале времени сравниваются фрагменты матрицы, которые следуют до или после сообщений с одинаковой оценкой по одному или более признаков. Оценивается корреляционная зависимость с одинаковым фильтром данных на совмещенных отрезках времени. Если для двух и более фрагментов матрицы корреляционная зависимость высока, то осуществляется уточнение связей в таких примерах. Фильтр данных сужается. Данные о настройках и результатах поиска записываются в базу данных как шаблон. Обнаруженные примеры оцениваются человеком на предмет значимости. Новый или повторный поиск шаблона начинается с настроек, объединяющих два или более известных шаблона с похожими кодами сообщений. Шаблоны с высокой оценкой значимости чаще используются для формирования комбинированных настроек поиска. Фильтр данных дополнительно расширяется с использованием случайных значений. Образно выражаясь, критерии поиска шаблонов эволюционируют путем скрещивания, мутации и отбора. Предсказательная сила анализа выражается в оценке вероятности, с которой новое или предполагаемое сообщение укладывается в выявленные ранее шаблоны. Примеры последовательностей сообщений из прошлого показывают, что чаще всего случается при похожих обстоятельствах.


Это не замена человека, а расширение когнитивных способностей дополнительной памятью и анализом коллективного опыта. Это не инструмент для подчинения, это инструмент для выявления фальши.

Применение (горизонт 2-10 лет):

* Анализ новостей и реконструкция факторов, влияющих на мнение человека.
* Обнаружение условий возникновения и исчезновения разногласий.
* Реконструкция связей между данными пользователя и содержанием адресной рекламы.
* Реконструкция условий лояльности.
* Дебаггинг социальной инженерии.
* Выявление шаблонов маркетинга, софистики, пикапа, пранка и других привычек.

Развитие проекта

Октябрь 2018. Идея
Ноябрь 2018. Выбор источника данных
Декабрь 2018. Составление классификатора
Январь 2019. Алгоритм анализа
Март 2019. Начало сбора данных
Декабрь 2019. Публикация LT6685
2020. На паузе

Альтернативные и дополнительные исследования

Google - DeepMind.
IBM Research - Debater.

Искусственный интеллект для человека разумного




Маркировка Финансирование без насилия означает, что проект не получает поддержки от государства или иных субъектов, которые используют принуждение для отъема средств. Я трачу на исследование столько времени, сколько могу.