計算機軟件

高級搜索和查詢語言。 搜索引擎語言

查詢語言是人工創建的編程語言,用於在數據庫和信息系統中進行查詢。

通常,這種查詢方法可以根據它們是用於數據庫還是用於信息檢索來分類。 不同的是,對這些服務的請求是為了獲得所提出的問題的實際答案,而搜索引擎試圖找到包含與用戶感興趣區域有關的信息的文檔。

數據庫

數據庫的查詢語言包括以下示例:

  • QL - 面向對象,指 關係數據庫; Datalog的繼任者
  • 上下文(CQL)是信息檢索系統(如Web索引或書目目錄)的正式查詢表示語言。
  • CQLF(CODYASYL) - 用於CODASYL-TYPE數據庫。
  • 在各自的模型(com)中使用概念導向查詢語言(COQL)。 它是基於數據建模的原理,並將其用於多維分析,分析操作和結論的投影和去投影等操作。
  • DMX - 用於數據挖掘模型。
  • 數據記錄是對演繹數據庫的查詢語言。
  • Gellish英語是一種可用於Gellish英語數據庫中查詢的語言,可讓您進行對話(查詢和答案),還可用於知識的 信息建模 。
  • HTSQL - 將http請求轉換為SQL。
  • ISBL - 用於PRTV(第一個關係 數據庫管理系統之一)。
  • LDAP是使用TCP / IP的查詢和目錄服務的協議。
  • OLAP數據庫需要MDX。

搜索引擎

搜索查詢的語言反過來旨在在搜索引擎中查找數據。 它的不同之處在於,通常查詢包含純文本或超文本與附加語法(例如,“和”/“或”)。 它與標準類似的語言顯著不同,這些語言受嚴格的命令語法規則或包含位置參數的限制。

搜索查詢如何分類?

涵蓋大多數搜索查詢的三大類:信息,導航和事務。 雖然這種分類在理論上不是固定的,但是由搜索引擎中實際查詢的存在證實了這一點。

信息請求是涵蓋廣泛話題(例如,特定城市或卡車模型)的信息請求,可以獲得數千個相關結果。

導航 - 這些是在特定主題(例如YouTube)上搜索一個網站或網頁的查詢。

交易 - 反映用戶執行某些操作的意圖,例如購買汽車或預訂機票。

搜索引擎通常支持第四種類型的查詢,這種查詢的使用頻率較低。 這些是所謂的連接請求,其中包含關於索引的Web圖形的連接性的報告(到特定URL的鏈接的數量,或從特定域索引多少頁)。

搜索信息如何?

大多數搜索資源不會公開其搜索日誌,因此很難找到有關用戶在網絡上查找的信息。 然而,第一次科學研究出現在1998年。 後來,2001年進行了一項後續調查,分析了與高度相關的查詢。 搜索引擎 如何使用查詢語言也變得清晰。

與網絡搜索相關的一些有趣的特徵變得已知:

搜索查詢的平均長度為2.4個字。

  • 大約一半的用戶發送了一個請求,少於三分之一的用戶逐個進行了三個或更多的唯一查詢。
  • 幾乎一半的用戶只查看了結果的前一頁或兩頁。
  • 少於5%的用戶使用高級搜索功能(例如,某些類別的選擇或搜索中的搜索)。

自定義操作的功能

該研究還顯示,19%的查詢包含地理術語(例如,名稱,郵政編碼,地理對像等)。 還有一點值得注意的是,除了短查詢(也就是說,有幾個條件),常常存在可預測的方案,根據哪些用戶改變了他們的搜索短語。

還發現一個用戶的33%的請求被重複,在87%的用戶將點擊相同的結果。 這表明許多用戶使用重複的請求來查看或重新查找信息。

頻率查詢分發

此外,專家確認查詢的頻率分佈符合冪律。 也就是說,在最大的請求列表中觀察到一小部分關鍵字(例如,超過1億個),並且它們是最常用的。 相同科目中的其餘短語使用次數較少,更多。 這種現像被稱為帕累托原則 (或“規則80-20”),它允許搜索引擎使用數據庫索引或分區,緩存和主動下載等優化方法,還可以改進搜索引擎查詢的語言。

近年來,平均查詢長度隨著時間的推移不斷增加。 所以英文的平均查詢時間變長了。 在這方面,Google推出了一個稱為“蜂鳥”(2013年8月)的更新,它能夠處理具有非言語“口語”查詢語言(例如“最近的咖啡館在哪裡”)的長搜索短語。

對於較長的查詢,使用它們的處理 - 它們被分為用標準語言制定的短語,並且分別顯示不同部分的答案。

結構化查詢

支持 邏輯操作 和語法的搜索引擎使用更高級的查詢語言。 搜索涵蓋幾個主題或面孔的文檔的用戶可以通過該單詞的邏輯表徵來描述它們中的每一個。 邏輯查詢語言的核心是特定短語和標點符號的集合。

什麼是高級搜索?

“Yandex”和“Google”的查詢語言能夠在一定條件下進行更具體的搜索。 高級搜索可以搜索頁面名稱或標題前綴的一部分,以及某些類別和名稱列表。 它還可以限制搜索包含標題中特定單詞或某些主題組的頁面。 通過正確使用查詢語言,它可以處理參數比大多數搜索引擎的表面結果復雜一個數量級,包括用戶使用帶有變量結尾和類似拼寫的單詞給出的參數。 顯示高級搜索的結果時,將顯示指向頁面相關部分的鏈接。

還可以搜索包含特定短語的所有頁面,而通過標準查詢,搜索引擎不能停留在討論的任何頁面上。 在許多情況下,查詢語言可以導致noindex標籤中的任何頁面。

在某些情況下,格式正確的查詢可讓您查找包含多個特殊字符和其他 字母的字母( 例如漢字)的信息。

查詢語言的字符如何讀取?

搜索中不包括大寫和小寫,以及一些變音符號(變音符號和重音符號)。 例如,搜索關鍵字雪鐵龍沒有找到包含單詞“雪鐵龍”的頁面。 但是一些連字對應於單個字母。 例如,搜索單詞“aeroscope”將很容易找到包含“Ereskebing”(AE =Æ)的頁面。

許多非字母數字字符不斷被忽略。 例如,找不到包含字符串| L |的查詢的信息是不可能的 (兩條垂直條之間的字母),儘管在某些轉換模板中使用了此符號。 只有LT中的數據才會在結果中。 一些符號和短語以不同的方式處理:“信用(金融)”查詢顯示具有單詞“信用”和“金融”的文章,忽略括號,即使存在具有確切名稱“credit(Finance)”的文章。

有很多功能可以用於查詢語言。

句法

“Yandex”和“Google”的查詢語言可以使用一些標點符號來優化搜索。 例如,花括號{{search}}。 其中包含的短語將被完全搜索,而無需更改。

雙引號中的短語允許您確定搜索的對象。 例如,一個引用的詞將被認定為被用作比喻或虛構的角色,沒有引號 - 作為更具紀錄性的信息。

此外,所有主要的搜索引擎支持邏輯“不”的“ - ”字符,還有/或。 一個例外是使用連字符或破折號前綴不能分隔的術語。

搜索短語的不准確對應用〜符號標記。 例如,如果您不記得術語或標題的確切措辭,則可以在具有指定字符的搜索字符串中指定它,您將能夠獲得最大相似度的結果。

自定義搜索參數

還有搜索參數,如intitle和incategory。 它們是以“filter:query string”的形式通過冒號顯示的過濾器。 查詢字符串可以包含搜索詞或短語,或部分或全頁名稱。

功能“intitle:query”以搜索結果的名稱為準,同時也顯示標題內容的通常結果。 可以同時使用幾個這樣的過濾器。 如何使用這個機會?

“intitle:機場名稱”表格的要求將發放所有包含機場標題的文章。 如果您將其定義為“停車場名稱:機場名稱”,那麼您將收到標題中機場名稱的文章,並在文中提及停車位。

搜索“分類:類別”過濾器的工作原理是首先發布屬於某個組或頁面列表的文章。 例如,“寺廟類別:歷史”類型的搜索查詢將會產生關於寺廟歷史的結果。 該功能也可以通過設置各種參數作為擴展功能。

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 zhtw.atomiyme.com. Theme powered by WordPress.