2024 Autor: Howard Calhoun | [email protected]. Ostatnio zmodyfikowany: 2023-12-17 10:38
Współczesnemu człowiekowi trudno wyobrazić sobie życie bez Internetu i niemal natychmiastowego dostępu do źródeł informacji. Użytkownik rzadko myśli o tym, w jaki sposób przeprowadzane jest wyszukiwanie pożądanej treści w sieci. Ale to jest bardzo interesujące.
System wyszukiwania informacji (IPS) to złożony system oprogramowania i sprzętu, który wybiera informacje na żądanie użytkownika. Informacje są przechowywane na serwerach w postaci cyfrowej, tak jak kiedyś książki znajdowały się na półkach bibliotek. System składa się z wielu podsystemów. Każdy realizuje swoje zadanie w procesie przetwarzania żądania użytkownika i przekazywania mu informacji w formie tekstowej lub dźwiękowej. Wielość zadań do rozwiązania determinuje złożoność architektury nowoczesnych systemów wyszukiwania informacji (skrót od systemu wyszukiwania informacji). Rodzaj "czarnej skrzynki": na wejściu - tekst zapytania, co jest w środku - nieznany, na wyjściu - wyczerpująca informacja.
strumienie wejściowe
Żądania informacji, które dana osoba tworzy w formie tekstowej na ekranie swojego gadżetu,stanowią niewielką część zapytań przetwarzanych przez wyszukiwarkę. Główne tablice zapytań wyszukiwania są tworzone przez roboty, które akceptują ludzkie żądania i przeprowadzają wieloetapowe wyszukiwanie i informacje zwrotne z użytkownikiem. Systemy wyszukiwania informacji obejmują znane firmy Google, Yandex i inne, które codziennie przetwarzają miliony żądań.
Źródła wyszukiwania obiektów
Zbiór początkowych obiektów zainteresowania wyszukiwania to dokumenty, zapisy, filmy, obrazy i inne. Tworzone są poza IPS. Ogólny system przechowywania i wyszukiwania informacji powinien mieć wbudowany system bibliograficzny - rodzaj katalogu, który umożliwia wyszukiwanie dowolnego rodzaju obiektów.
Obiekty lub ich transformacje cyfrowe stają się „zasobem wejściowym” do IPS. To wśród nich wybierane są informacje, których potrzebuje użytkownik.
Źródła zewnętrzne
Widok wyboru informacji wykorzystuje zewnętrzne źródła wiedzy. To są informacje, których szuka użytkownik. Tytuł filmu, cytat z książki i nie tylko. W przypadku wyszukiwania komputerowego informacje te muszą zostać przetłumaczone na zapytanie w języku algorytmicznym. W IPS odbywa się to za pomocą bloku do tworzenia, indeksowania i rozwijania zapytań.
W idealnym przypadku te trzy procesy - reprezentacja, indeksowanie i tworzenie zapytań - powinny opierać się na identycznych źródłach wiedzy, ale w praktyce nie jest to możliwe.
Źródła wiedzy powinny być stale przeglądane i aktualizowane, a aktualizacja powinna być identyczna izsynchronizowane. A zewnętrzne źródło wiedzy zawsze chronologicznie wyprzedza jego wykorzystanie w wyszukiwarkach dla zapytania, czasami o kilka lat.
Występy
Reprezentacje oryginalnych obiektów składają się z danych wejściowych w pewnej kombinacji lub są przekształcone zgodnie z regułami i algorytmami konkretnego systemu wyszukiwania informacji.
Widoki to mniej lub bardziej przekształcone kopie oryginalnego obiektu wyszukiwania. W zbiorze nieedytowanych tekstów pełnych każdy tekst jest własną reprezentacją. W zbiorze obiektów eksponatów muzealnych i artefaktów reprezentacją może być przetworzony opis obiektu wraz z jego wizerunkiem. W niektórych przypadkach reprezentacja może częściowo pochodzić z oryginalnego obiektu, a częściowo z opisu: w wyszukiwarkach bibliograficznych reprezentacje pochodzą z obiektu - np. tytuł, nazwisko autora zostanie połączone z adnotacją pracy.
Przeszukiwalny indeks
Ponieważ informacje w systemach wyszukiwania informacji są przechowywane w formie reprezentacji, logiczne jest założenie, że wyszukiwanie odbywa się zgodnie z reprezentacją i po dokonaniu wyboru jest przekazywane użytkownikowi. W praktyce tak nie jest. Na przykład obecne katalogi biblioteczne online zazwyczaj ograniczają wyszukiwanie do kilku pól: autora, tytułu i napisów w widoku zawierającym inne pola, które nie są przeszukiwane. To wystarczający powód, dla którego konieczne jest rozróżnieniewidok i przeszukiwalny indeks, który jest częścią wyszukiwania w widoku. Definiuje wszystko, co powinno być przeszukiwalne. Przeszukiwalny indeks, taki jak widok i obiekt źródłowy, można podzielić na oddzielne podindeksy, aby zapewnić bardziej precyzyjne, ukierunkowane wyszukiwania
Wyszukiwarki zwykle mają wewnętrznie syntetyczną strukturę do dopasowywania prawidłowych wyników wyszukiwania. Ta struktura jest drugim składnikiem przeszukiwalnego indeksu.
Proceduralnie proces indeksowania można wdrożyć na różne sposoby: indeks z możliwością przeszukiwania można uzyskać przez:
- dosłowne kopiowanie przeszukiwalnej reprezentacji;
- kopiując szczegóły widoku. Może to być część lub wszystkie widoki, które fizycznie istnieją tylko jako fragmenty, dystrybuowane zgodnie z zasadami tworzenia indeksu wyszukiwania, który będzie gromadzony w razie potrzeby.
Poproś o zasady projektowania i formalne wnioski
Inżynieria zapytań to funkcja pośrednicząca między zapytaniem użytkownika a zapytaniem formalnym. Przekształca zapytanie użytkownika, dopasowując je do słowników poleceń pobierania, specyfikacji indeksu i indeksu przed pobraniem. Na początku rozwoju IPS rolę tę tradycyjnie przypisywano wykwalifikowanym informatykom.
Tworzenie zapytań komputerowych, które mogą dopasowywać zapytania słownikowe do przeszukiwalnego systemu indeksowego, jest powszechnie określane jako moduł "wprowadzania słownikowego". Automatyzacja tej funkcji jest obiecująca i daje możliwości dla eksperckich i probabilistycznych metod wyszukiwania.
Formalne żądanie staje się formalnym żądaniem po przekonwertowaniu żądania użytkownika. Przykłady takich formalnych przekształceń obejmują obcinanie, podstawianie, normalizację, wektoryzację i inne przekształcenia „zewnętrznej” reprezentacji na „wewnętrzną” reprezentację komputerowego IPS (deszyfrowania - systemu wyszukiwania informacji).
Zestawy wyodrębnionych linków do dokumentów
Wynikowy zestaw źródeł informacji jest logicznie podzbiorem widoków utworzonych przez dopasowujące reguły zastosowane do formalnego zapytania za pomocą przeszukiwalnego indeksu.
Zazwyczaj, ale niekoniecznie, istnieje oddzielny proces sortowania odzyskanego zestawu informacji. Internetowe katalogi biblioteczne zazwyczaj zmieniają kolejność otrzymanych zestawów alfabetycznie według autorów przed ich wyświetleniem. W systemach wyszukiwania informacji, które tworzą ścisłe rankingi, kolejność rankingu poprzedza każdą zmianę kolejności.
Strumienie wyjściowe
Wyprowadzanie wyników wyszukiwania odbywa się tradycyjnie na wyświetlaczu, częściej w postaci strumienia obiektów do wykorzystania w innym miejscu lub w jakimś innym celu, uzupełnia główną pętlę wyszukiwania. Takie strumienie mogą być przesyłane do urządzeń wizualizacyjnych, przechowywanie do dalszego przetwarzania lub wykorzystanie jako strumieni wejściowych do innych usług wyboru.
Systemy wyszukiwania informacji umożliwiają przekazywanie informacji zwrotnychwynik dowolnego procesu selekcji. Wynikiem dowolnego procesu może być informacja zwrotna dla innych procesów. Informacje zwrotne mogą stanowić podstawę oceny eksperckiej na każdym etapie.
Zalecana:
Księgowość to Cechy procesu podsumowania informacji
Rachunkowość jest elementem zarządzania obiektami i procesami gospodarczymi. Jego istota polega na ustalaniu parametrów i statusu zdarzeń i faktów, gromadzeniu, podsumowywaniu, gromadzeniu informacji i odzwierciedlaniu ich w odpowiednich wypowiedziach. Rachunkowość prowadzona jest w różnych obszarach działalności
Systemy informacji gospodarczej: definicja, koncepcja i struktura
Dzisiaj przetwarzanie danych jest niezależnym obszarem z różnymi metodami i pomysłami. Co więcej, poszczególne elementy tego procesu osiągnęły wysoki stopień wzajemnego połączenia i dobry stopień organizacji. Dzięki temu możliwe jest połączenie wszystkich narzędzi przetwarzania informacji przy konkretnym obiekcie gospodarczym, który nazywany jest „systemem informacji gospodarczej” (EIS)
Automatyzacja systemów sterowania: poziomy, narzędzia, funkcje i aplikacje
Automatyzacja systemów sterowania, w skrócie ACS, to zestaw urządzeń, który pozwala skutecznie i półautomatycznie lub w pełni automatycznie monitorować przebieg procesu. Są najszerzej stosowane w przemyśle
Karta przedsiębiorstwa jako klucz do podstawowych informacji
Ten dokument zawiera wszystkie możliwe dane bankowe: nazwę banku, jego indywidualny numer, adres, numery kont (zwłaszcza rachunki rozliczeniowe), kto jest odbiorcą przelewanych środków itp. Karta firmowa może zawierać informacje o tym kto ma prawo do podpisywania dokumentów kierownictwo firmy
Gdzie szybko i bez zbędnych informacji uzyskać pożyczkę w Wołgogradzie
Prawie każdy z nas przynajmniej raz w życiu znalazł się w sytuacji, w której pieniądze są pilnie potrzebne, a pożyczenie od znajomych jest niemożliwe. Musisz skontaktować się z bankiem, ale rozpatrzenie wniosku może potrwać nawet kilka dni. Jak znaleźć się w takiej sytuacji? Gdzie uzyskać pożyczkę w Wołgogradzie?