polski   english  

Informacje

Repozytorium

Poprawne formułowanie zapytań

Wprowadzenie:

Przed rozpoczęciem wyszukiwania należy zapoznać się z poniższymi uwagami:

Istnieją dwa typy terminów wyszukiwawczych:

- terminy proste czyli pojedyncze wyrazy np. "park", "ławka"

- frazy czyli kilka wyrazów ujętych w cudzysłów np. „ławka w parku”

Terminy wyszukiwawcze można łączyć za pomocą operatorów logicznych oraz tzw. znaków maskujących , które mogą zastąpić dowolne znaki alfanumeryczne.

Znaki maskujące:

? - zastępuje jeden dowolny znak np. zapis: wo?a powoduje wyszukanie słów takich jak: woda, woła, wola.

* - zastępuje ciąg jednego lub wielu znaków np. zapis: wo* powoduje wyszukanie takich słów i fraz jak woda, wodzirej, "woda mineralna"; można również wstawiać * w środek poszukiwanego terminu np. zapis: po*a powoduje wyszukanie takich słów i fraz jak: pogoda, poda, podgląda.

Znaku maskującego nie można wstawiać na początku poszukiwanego terminu.

Operatory logiczne:

AND (iloczyn logiczny) - alternatywny zapis && - oznacza, że terminy połączone operatorem iloczynu logicznego muszą jednocześnie występować w przeszukiwanym dokumencie np. zapytanie w postaci Sienkiewicz && Prus spowoduje wybranie tylko takich dokumentów, w których nazwiska obu pisarzy występują jednocześnie.

OR (suma logiczna) - alternatywny zapis || - oznacza, iż wystarczy, aby jeden z terminów, połączonych operatorem sumy logicznej występował w przeszukiwanym dokumencie np. zapytanie w postaci Sienkiewicz || Prus spowoduje wybranie dokumentów, w których wystąpiło nazwisko jednego z obu pisarzy.

NOT (negacja) - alternatywny zapis ! - odrzuca z listy wyników te dokumenty, w których występuje termin wskazany po wywołaniu operatora (NOT bądź !) np. zapytanie w postaci "Adam Słodowy" NOT "reklama" spowoduje wybranie dokumentów, zawierających frazę "Adam Słodowy", ale nie zawierających jednocześnie słowa reklama. Operator ten nie może być stosowany tylko przy jednym terminie np. zapytanie w postaci NOT „Adam Słodowy” nie zadziała.

+ (operator terminu wymaganego) - zapis zawierający termin podany bezposrednio po operatorze "+" spowoduje wybranie dokumentów zawierających ten termin lecz niekoniecznie pozostałe terminy z zapytania np. +biblioteka uniwersytecka spowoduje wybranie dokumentów, które muszą zawierać słowo biblioteka i mogą (ale nie muszą) zawierać słowo: uniwersytecka.

- (operator terminu zakazanego) - działanie identyczne jak operator NOT (patrz opis wcześniej).

Łączenie zapytań:

Zapytania informacyjne można łączyć w celu tworzenia zapytań złożonych. Aby połączyć zbiór słów kluczowych i operatorów logicznych należy wykorzystać nawiasy okrągłe. Przy zastosowaniu tych nawiasów najpierw będą przetwarzane zapytania wewnątrz nawiasów, a następnie dalsze np. zapytanie w postaci: ( "Uniwersytet Wrocławski" OR "Uniwersytet Warszawski") AND "Strona www" spowoduje wybranie dokumentów zawierających informacje o stronach internetowych (www) wspomnianych uniwersytetów, a nie wybierze dokumentów zawierających jedynie wzmianki o którejś z uczelni.

Znaki specjalne:

Z uwagi na rozbudowane funkcje systemu wyszukiwawczego część znaków jest traktowana jako operatory. Do grupy tej należą znaki : + - && || ! ( ) { } [ ] ^ " ~ * ? : \. Aby objąć procesem wyszukiwania podane znaki, należy przed ich wpisaniem umieścić specjalny znak \ np. w celu wyszukania frazy "(2 + 2):2 = 2" należy wpisać "\( 2 \+ 2 \) \: 2".

Wyszukiwanie rozmyte:

Wyszukiwanie rozmyte (fuzzy searches) jest nową funkcją wyszukiwania. Znajduje ona zastosowanie przy wyszukiwaniu terminów prostych podobnych do siebie np. gór, kur, bór. Stopień poszukiwanego podobieństwa, można określić współczynnikiem, który zmienia się w zakresie od 0 (brak podobieństwa) do 1 (terminy identyczne). Domyślnie współczynnik podobieństwa ustawiony jest na wartość 0.5. W celu zastosowania wyszukiwania rozmytego na końcu poszukiwanego terminu dodać należy znak ~ (tylda) oraz opcjonalnie współczynnik podobieństwa np. gór~0.8.

Źródło opisu:

Pełny opis sposobu formułowania zapytań (strona w języku angielskim): Jakarta Lucene Query Parser Syntax.

 

Zobacz również: