世界上不可能有比布爾代數(shù)運(yùn)算更簡單的計(jì)算方式了,它只有“0”和“1”兩個數(shù)字組成。搜索引擎是世界上最復(fù)雜的系統(tǒng)之一,而其最重要文獻(xiàn)檢索卻不能離開最簡單的布爾代數(shù)運(yùn)算!
布爾代數(shù)運(yùn)算元素只有兩個:1(TURE,真)和0(FALSE,假)?;镜倪\(yùn)算只有“與”(AND)、“或”(OR)、“非” (NOT)。在“與”(AND)運(yùn)算中,當(dāng)且只有兩個“1”(真)時,其結(jié)果才為“1”(真),即:1 and 1 =1 , 0 and 1 =0, 0 and 0 = 0。在“或”(OR)運(yùn)算中,只要有一個為“1”時,其結(jié)果即為“1”,即:1 or 1 =1 ,0 or 1 = 1 , 0 or 0 = 0。在“非”(NOT)運(yùn)算中,“1”取非后即為“0”,“0”取非后為“1”。
現(xiàn)在看看文獻(xiàn)檢索和布爾運(yùn)算的關(guān)系。對于一個用戶輸入的關(guān)鍵詞,搜索引擎要判斷每篇文獻(xiàn)是否含有這個關(guān)鍵詞,如果一篇文章含有這個詞,我們就給這篇文獻(xiàn)一個邏輯詞——真(TRUE 或 1),否則,給這這篇文章一個邏輯詞——假(FALSE 或者 0)。
比如要找關(guān)于”原子能應(yīng)用的文獻(xiàn),但是不想知道如何制造原子彈。搜索引擎將從通過以下查詢語句 “原子能 AND 應(yīng)用 AND (NOT 原子彈)”,表示符合要求的文獻(xiàn)必須同時滿足三個條件:包含原子能,包含應(yīng)用,不包含原子彈。
一個文獻(xiàn)對應(yīng)上面的每個條件都會得到一個TURE 或者 FALSE結(jié)果,根據(jù)上述真值表就能判斷每篇文獻(xiàn)是否是要找的。
布爾代數(shù)的主要作用是把連續(xù)的信息轉(zhuǎn)換成離散信息,從而能對這些信息進(jìn)行深度處理。搜索引擎在文獻(xiàn)檢索中同樣應(yīng)用了布爾代數(shù)的這個特征把一個個具體的句子拆分成可供參考分析的關(guān)鍵詞序列。