Семантический способ измерения информации

- Семантический способ
Семантический способ измерения информации отзывы

Семантическое сходство

Обработка естественного языка

1. Семантическое сходство - это метрика, определенная над набором документов или терминов, где идея расстояния между ними основананаподобие ихзначения или семантического содержания, а не на сходстве.

2. Которое может быть оценено относительно их синтаксического представления (например, их строкового формата).

3.

Это математические инструменты, используемые для оценки силы семантической связи между единицами языка.

4. Понятий или экземпляров, посредством численного описания, полученного в соответствии с сопоставлением информации.

5. Поддерживающей их значение или описывающей их характер.

6. Термин семантическое сходство часто смешивается со смысловой связностью.

7. Семантическая взаимосвязь включает в себя любое соотношение между двумя терминами, в то время как семантическое сходство включает только «является» отношением.Приложения

Например, «автомобиль» похож на «автобус», но также связан с «дорогой» и «вождением».

Вычислительно, семантическое сходство может быть оценено путем определения топологического подобия, используя онтологии для определения расстояния между терминами / понятиями. Например, наивная метрика для сравнения понятий, упорядоченных в частично упорядоченном множестве и представленных в виде узлов ориентированного ациклического графа (например, таксономия), будет кратчайшим путем, связывающим два концептуальных узла. На основе анализа текста семантическая взаимосвязь между единицами языка (например, словами, предложениями) также может быть оценена с использованием статистических средств, таких как модель векторного пространства для корреляции слов и текстовых контекстов из подходящего текстового корпуса.

Несколько инструментов используются для измерения семантического сходства между понятиями, такими как WNetSS API, который является Java API, манипулирующим множеством измерений семантического подобия на основе семантического ресурса WordNet.

ТерминологияВизуализация

Концепция семантического сходства более специфична, чем смысловая взаимосвязь, поскольку последняя включает понятия как антонимию иГерониму, а сходства нет. [6] Однако, большая часть литературы использует эти термины взаимозаменяемо, наряду с терминами, такими как семантическое расстояние. По сути, семантическое сходство, семантическое расстояние и смысловая взаимосвязь означают: «Сколько термин А имеет отношение к термину Б?» Ответ на этот вопрос обычно представляет собой число от -1 до 1 или от 0 до 1, где 1 означает чрезвычайно высокое сходство.

ВизуализацияТерминология

1. Интуитивный способ визуализации семантической подобия терминов состоит в объединении терминов, которые тесно связаны и отличаются друг от друга.

2. Которые отдаленно связаны. Это также распространено на практике для карт разума и концептуальных карт и иногда является подсознательным

3. Более прямой способ визуализации семантического сходства двух лингвистических предметов можно увидеть с помощью подхода Semantic Folding. В этом подходе лингвистический элемент, такой как термин или текст, может быть представлен путем генерирования пикселя для каждой из его активных семантических функций, например, в сетке 128 на 128. Это позволяет прямое визуальное сравнение семантики двух элементов путем сравнения представлений изображений их соответствующих наборов признаков.

Приложения

Биомедицинская информатикаСемантическое сходство

В биомедицинских онтологиях применялись и разрабатывались методы, а именно, онтология генов (GO).

Они в основном используются для сравнения генов и белков, а не на их сходстве в последовательности, но они также распространяются на другие интенции, такие, как химические соединения, анатомические сущности и болезни.

Эти сравнения могут быть выполнены с использованием инструментов, свободно доступных в Интернете:

· CMPSim обеспечивает функциональную меру сходства между химическими соединениями и метаболическими путями с использованием методов семантического сходства на основе ChEBI.

· CESSM предоставляет инструмент для автоматической оценки мер по смысловому сходству на основе GO.

GeoInformatics

Сходство также применяется для поиска похожих географических признаков или типов объектов:

· Сервер сходства SIM-DL может использоваться для вычисления сходства между концепциями, хранящимися в онтологиях типа географических объектов.

· Калькулятор сходства можно использовать для расчета того, насколько хорошо связаны две географические концепции в онтологии Geo-Net-PT.

· OSM Семантическая сеть может быть использована для вычисления семантического сходства тегов в OpenStreetMap.

Вычислительная лингвистикаОтзыв о Семантический способ измерения информации

В нескольких показателях используется WordNet, созданная вручную лексическая база данных английских слов. Несмотря на преимущества наблюдения за человеком при построении базы данных, поскольку слова автоматически не узнаются, база данных не может измерять взаимосвязь между многословным термином, не инкрементным лексиконом. [6] [25]

Обработка естественного языка

Обработка естественного языка (НЛП) - это область информатики и лингвистики. Анализ настроений, понимание естественного языка и машинный перевод (автоматический перевод текста с одного человеческого языка на другой) являются некоторыми из основных областей, где он используется. Например, зная один информационный ресурс в Интернете, часто возникает непосредственный интерес к поиску подобных ресурсов. Web предоставляет семантические расширения чтобы найти похожие данные посодержанию, ане толькопроизвольными дескрипторами.

Меры

Существуют, по существу, два типа подходов, которые вычисляют топологическое сходство между онтологическими понятиями:

· Edge-based: которые используют ребра и их типы в качестве источника данных;

· Node-based: в котором основными источниками данных являются узлы и их свойства.

Другие меры подсчитывают между онтологическими примерами:

· Pairwise: измерить функциональное сходство между двумя экземплярами, объединив сходство концепций, которые они представляют Groupwise:

Рассчитывать сходство напрямую, не комбинируя семантические сходства концепций, которые они представляют

Некоторые примеры:

Узел на основе

· Прохождение маркера: объединение лексического разложения для автоматизированного создания онтологии и маркера. Переходя к подходу F?hndrich et al. Вводит новый тип смысловой меры. Здесь маркеры передаются из двух целевых концепций, несущих количество активации. Эта активация может увеличиваться или уменьшаться в зависимости от веса отношений, с которым связаны понятия. Это сочетает в себе подход на основе краев и узлов и включает в себя аргументацию подключений с символической информацией.

· Хорошая общая погрешность (GCS)

· Комментарий к применению на основе семантики к биомедицинским онтологиям

Золотые стандарты

Исследователи собирали наборы данных с суждениями по парам слов, которые используются для оценки когнитивной правдоподобия вычислительных мер. Золотой стандарт до сегодняшнего дня - это старый список из 65 слов, где люди оценивают слова.


Видео обзор

Все(5)
Семантический дифференциал в практике бизнес тренера. Коткин Дмитрий "ШИП"Кто такой копирайтер Рассказываем вам о том, кто занимается текстами в больших компаниях!007. Малый ШАД - Нейронные языковые модели в дистрибутивной семантике - Андрей КутузовМитап "Онтологическая грамотность человеческим языком" 20 фев 2018Lesson 6: Deep Learning 2018


Тэги: может быть, в интернете, х р, перевод текста



Комментарии на отзыв:

Добавить комментарий

Обязательно
Обязательно
Обязательно