IPS to Cel i funkcje systemów wyszukiwania informacji
IPS to Cel i funkcje systemów wyszukiwania informacji

Wideo: IPS to Cel i funkcje systemów wyszukiwania informacji

Wideo: IPS to Cel i funkcje systemów wyszukiwania informacji
Wideo: РЭРЗ | Ростовский электровозоремонтный завод (ГК «ЛокоТех») 2024, Marsz
Anonim

Współczesnemu człowiekowi trudno wyobrazić sobie życie bez Internetu i niemal natychmiastowego dostępu do źródeł informacji. Użytkownik rzadko myśli o tym, w jaki sposób przeprowadzane jest wyszukiwanie pożądanej treści w sieci. Ale to jest bardzo interesujące.

System wyszukiwania informacji (IPS) to złożony system oprogramowania i sprzętu, który wybiera informacje na żądanie użytkownika. Informacje są przechowywane na serwerach w postaci cyfrowej, tak jak kiedyś książki znajdowały się na półkach bibliotek. System składa się z wielu podsystemów. Każdy realizuje swoje zadanie w procesie przetwarzania żądania użytkownika i przekazywania mu informacji w formie tekstowej lub dźwiękowej. Wielość zadań do rozwiązania determinuje złożoność architektury nowoczesnych systemów wyszukiwania informacji (skrót od systemu wyszukiwania informacji). Rodzaj "czarnej skrzynki": na wejściu - tekst zapytania, co jest w środku - nieznany, na wyjściu - wyczerpująca informacja.

Plik karty w prawdziwym życiu
Plik karty w prawdziwym życiu

strumienie wejściowe

Żądania informacji, które dana osoba tworzy w formie tekstowej na ekranie swojego gadżetu,stanowią niewielką część zapytań przetwarzanych przez wyszukiwarkę. Główne tablice zapytań wyszukiwania są tworzone przez roboty, które akceptują ludzkie żądania i przeprowadzają wieloetapowe wyszukiwanie i informacje zwrotne z użytkownikiem. Systemy wyszukiwania informacji obejmują znane firmy Google, Yandex i inne, które codziennie przetwarzają miliony żądań.

Źródła wyszukiwania obiektów

Zbiór początkowych obiektów zainteresowania wyszukiwania to dokumenty, zapisy, filmy, obrazy i inne. Tworzone są poza IPS. Ogólny system przechowywania i wyszukiwania informacji powinien mieć wbudowany system bibliograficzny - rodzaj katalogu, który umożliwia wyszukiwanie dowolnego rodzaju obiektów.

Obiekty lub ich transformacje cyfrowe stają się „zasobem wejściowym” do IPS. To wśród nich wybierane są informacje, których potrzebuje użytkownik.

Szukać informacji
Szukać informacji

Źródła zewnętrzne

Widok wyboru informacji wykorzystuje zewnętrzne źródła wiedzy. To są informacje, których szuka użytkownik. Tytuł filmu, cytat z książki i nie tylko. W przypadku wyszukiwania komputerowego informacje te muszą zostać przetłumaczone na zapytanie w języku algorytmicznym. W IPS odbywa się to za pomocą bloku do tworzenia, indeksowania i rozwijania zapytań.

W idealnym przypadku te trzy procesy - reprezentacja, indeksowanie i tworzenie zapytań - powinny opierać się na identycznych źródłach wiedzy, ale w praktyce nie jest to możliwe.

Źródła wiedzy powinny być stale przeglądane i aktualizowane, a aktualizacja powinna być identyczna izsynchronizowane. A zewnętrzne źródło wiedzy zawsze chronologicznie wyprzedza jego wykorzystanie w wyszukiwarkach dla zapytania, czasami o kilka lat.

System wyszukiwania informacji
System wyszukiwania informacji

Występy

Reprezentacje oryginalnych obiektów składają się z danych wejściowych w pewnej kombinacji lub są przekształcone zgodnie z regułami i algorytmami konkretnego systemu wyszukiwania informacji.

Widoki to mniej lub bardziej przekształcone kopie oryginalnego obiektu wyszukiwania. W zbiorze nieedytowanych tekstów pełnych każdy tekst jest własną reprezentacją. W zbiorze obiektów eksponatów muzealnych i artefaktów reprezentacją może być przetworzony opis obiektu wraz z jego wizerunkiem. W niektórych przypadkach reprezentacja może częściowo pochodzić z oryginalnego obiektu, a częściowo z opisu: w wyszukiwarkach bibliograficznych reprezentacje pochodzą z obiektu - np. tytuł, nazwisko autora zostanie połączone z adnotacją pracy.

Znajdowanie tego, czego potrzebujesz
Znajdowanie tego, czego potrzebujesz

Przeszukiwalny indeks

Ponieważ informacje w systemach wyszukiwania informacji są przechowywane w formie reprezentacji, logiczne jest założenie, że wyszukiwanie odbywa się zgodnie z reprezentacją i po dokonaniu wyboru jest przekazywane użytkownikowi. W praktyce tak nie jest. Na przykład obecne katalogi biblioteczne online zazwyczaj ograniczają wyszukiwanie do kilku pól: autora, tytułu i napisów w widoku zawierającym inne pola, które nie są przeszukiwane. To wystarczający powód, dla którego konieczne jest rozróżnieniewidok i przeszukiwalny indeks, który jest częścią wyszukiwania w widoku. Definiuje wszystko, co powinno być przeszukiwalne. Przeszukiwalny indeks, taki jak widok i obiekt źródłowy, można podzielić na oddzielne podindeksy, aby zapewnić bardziej precyzyjne, ukierunkowane wyszukiwania

Wyszukiwarki zwykle mają wewnętrznie syntetyczną strukturę do dopasowywania prawidłowych wyników wyszukiwania. Ta struktura jest drugim składnikiem przeszukiwalnego indeksu.

Proceduralnie proces indeksowania można wdrożyć na różne sposoby: indeks z możliwością przeszukiwania można uzyskać przez:

  • dosłowne kopiowanie przeszukiwalnej reprezentacji;
  • kopiując szczegóły widoku. Może to być część lub wszystkie widoki, które fizycznie istnieją tylko jako fragmenty, dystrybuowane zgodnie z zasadami tworzenia indeksu wyszukiwania, który będzie gromadzony w razie potrzeby.
Zarządzanie wyszukiwaniem
Zarządzanie wyszukiwaniem

Poproś o zasady projektowania i formalne wnioski

Inżynieria zapytań to funkcja pośrednicząca między zapytaniem użytkownika a zapytaniem formalnym. Przekształca zapytanie użytkownika, dopasowując je do słowników poleceń pobierania, specyfikacji indeksu i indeksu przed pobraniem. Na początku rozwoju IPS rolę tę tradycyjnie przypisywano wykwalifikowanym informatykom.

Tworzenie zapytań komputerowych, które mogą dopasowywać zapytania słownikowe do przeszukiwalnego systemu indeksowego, jest powszechnie określane jako moduł "wprowadzania słownikowego". Automatyzacja tej funkcji jest obiecująca i daje możliwości dla eksperckich i probabilistycznych metod wyszukiwania.

Formalne żądanie staje się formalnym żądaniem po przekonwertowaniu żądania użytkownika. Przykłady takich formalnych przekształceń obejmują obcinanie, podstawianie, normalizację, wektoryzację i inne przekształcenia „zewnętrznej” reprezentacji na „wewnętrzną” reprezentację komputerowego IPS (deszyfrowania - systemu wyszukiwania informacji).

Zestawy wyodrębnionych linków do dokumentów

Wynikowy zestaw źródeł informacji jest logicznie podzbiorem widoków utworzonych przez dopasowujące reguły zastosowane do formalnego zapytania za pomocą przeszukiwalnego indeksu.

Zazwyczaj, ale niekoniecznie, istnieje oddzielny proces sortowania odzyskanego zestawu informacji. Internetowe katalogi biblioteczne zazwyczaj zmieniają kolejność otrzymanych zestawów alfabetycznie według autorów przed ich wyświetleniem. W systemach wyszukiwania informacji, które tworzą ścisłe rankingi, kolejność rankingu poprzedza każdą zmianę kolejności.

Analiza danych
Analiza danych

Strumienie wyjściowe

Wyprowadzanie wyników wyszukiwania odbywa się tradycyjnie na wyświetlaczu, częściej w postaci strumienia obiektów do wykorzystania w innym miejscu lub w jakimś innym celu, uzupełnia główną pętlę wyszukiwania. Takie strumienie mogą być przesyłane do urządzeń wizualizacyjnych, przechowywanie do dalszego przetwarzania lub wykorzystanie jako strumieni wejściowych do innych usług wyboru.

Systemy wyszukiwania informacji umożliwiają przekazywanie informacji zwrotnychwynik dowolnego procesu selekcji. Wynikiem dowolnego procesu może być informacja zwrotna dla innych procesów. Informacje zwrotne mogą stanowić podstawę oceny eksperckiej na każdym etapie.

Zalecana: