PPt4Web Хостинг презентаций

Главная / Информатика / Кластерный анализ и информационный поиск
X Код для использования на сайте:

Скопируйте этот код и вставьте его на свой сайт

X

Чтобы скачать данную презентацию, порекомендуйте, пожалуйста, её своим друзьям в любой соц. сети.

После чего скачивание начнётся автоматически!

Кнопки:

Презентация на тему: Кластерный анализ и информационный поиск


Скачать эту презентацию

Презентация на тему: Кластерный анализ и информационный поиск


Скачать эту презентацию



№ слайда 1 МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ Дмитрий Владимирович ЛАНДЭ Лекция 7“Кластерн
Описание слайда:

МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ Дмитрий Владимирович ЛАНДЭ Лекция 7“Кластерный анализи информационный поиск”

№ слайда 2 Понятие «кластерного анализа»Кластерный анализ - метод группировки экспериментал
Описание слайда:

Понятие «кластерного анализа»Кластерный анализ - метод группировки экспериментальных данных в классы. Наблюдения, попавшие в один класс, в некотором смысле ближе друг к другу, чем к наблюдениям из других классов. (Глоссарий.ru) Пример кластеров сайтов - «групп подобия по контенту»(www touchgraph.com)

№ слайда 3 Понятие информационного портрета Портрет - модель реального объекта, выраженную
Описание слайда:

Понятие информационного портрета Портрет - модель реального объекта, выраженную его наиболее узнаваемыми чертами. Информационный портрет документа - статистически значимая совокупность информационных характеристик. В качестве информационного портрета темы можно рассматривать множество ключевых слов, наиболее точно (по статистическим и смысловым алгоритмам) отражающее информацию, соответствующую данной теме.Тематической рубрике соответствует ее информационный портрет:Pi = { vij}, (j=1,..,K),где vij –весовой коэффициент, соответствующий j-му терм, K - количество термов в словаре системы.

№ слайда 4 Взвешивание потока документов в пространстве информационного портрета М = {mij}
Описание слайда:

Взвешивание потока документов в пространстве информационного портрета М = {mij} (i = 1,..,N; j = 1,..,K) - матрица соответствия потока документов D информационному портрету l. D={di} {i=1,K}. di – определяется как TF*IDF.Близость D и Pi – sim(D, Pi) – скалярное произведение K-мерных векторов.Алгоритм взвешивания:

№ слайда 5 Метод кластерного анализа LSI (латентного семантического индексирования), базиру
Описание слайда:

Метод кластерного анализа LSI (латентного семантического индексирования), базируется на сингулярном разложении матриц (SVD). Сингулярным разложением матрицы A называется ее разложение вида A=USVT, где U и V – ортогональные матрицы, а S – диагональная матрица, элементы которой sij = 0, если i не равно j, а siі >= 0. В рассматриваемом примере (таблиц взаимосвязей) матрица А = МT М – квадратная, однако метод LSI применяется и к прямоугольным матрицам, но в этих случаях размерность матрицы S соответствует рангу матрицы А.В соответствии с методом LSI в рассмотрение берутся k наибольших сингулярных значений, а каждому такому сингулярному значению матрицы А соответствует кластер взаимосвязанных документов. А аппроксимируется матрицей Ak = Σ ui sii viT. Метод LSI применим и к ранжированию выдачи информационно-поисковых систем, основанному на цитировании. Это алгоритм HITS (Hyperlink Induced Topic Search) – один из двух самых популярных на сегодня в области информационного поиска.Ввиду своей вычислительной трудоемкости (равной O(N2), N – размерность А), этот метод LSI применяется только для относительно небольших матриц.

№ слайда 6 Взаимосвязь тем и метод k-meansСуть алгоритма k-means: случайным образом выбирае
Описание слайда:

Взаимосвязь тем и метод k-meansСуть алгоритма k-means: случайным образом выбирается k векторов-строк, которые определяются как центроиды кластеров. Затем k кластеров наполняются – для каждого из оставшихся векторов-строк определяется близость к центроиду соответствующего кластера. После этого вектор-строка приписывается к тому кластеру, к которому он наиболее близок. После этого строки-векторы перегруппируются. Затем для каждого из новых кластеров заново определяется центроид. После этого заново выполняется процесс наполнения кластеров и т. д., пока процесс не стабилизируется или не зациклится.

№ слайда 7 Группировка тем метод k-means В отличие от метода LSI, k-means идеально подходит
Описание слайда:

Группировка тем метод k-means В отличие от метода LSI, k-means идеально подходит для кластеризации динамических информационных потоков. Укрупнение рубрик – актуальная задача кластерного анализа и она может быть решена путем их группировки по признакам подобия. Выделение групп взаимосвязанных рубрик методом кластерного анализа k-means:

№ слайда 8 Метод, основанный на применениисетевого подхода - выявление сюжетов
Описание слайда:

Метод, основанный на применениисетевого подхода - выявление сюжетов

№ слайда 9 Построение адаптивныхинтерфейсов уточнения запросов
Описание слайда:

Построение адаптивныхинтерфейсов уточнения запросов

№ слайда 10 Спасибо за внимание! Ландэ Д.Вdwl@visti.nethttp://poiskbook.kiev.ua МЕЖДУНАРОДНЫ
Описание слайда:

Спасибо за внимание! Ландэ Д.В[email protected]://poiskbook.kiev.ua МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ Киев, Украина

Скачать эту презентацию


Презентации по предмету
Презентации из категории
Лучшее на fresher.ru