A. 百度圖片的以圖搜圖功能工作原理什麽什麽
圖像搜索引擎需要為在Web上瀏覽過的圖像建立索引信息,能夠進行圖像分析和判別,為圖像加註釋,存儲抽取出的索引信息建立索引庫,理想的圖像搜索引擎還應該能支持基於內容的圖像檢索。
圖像識別方法
1、自動查找圖形文:可以通過兩個HTML標簽,即IMG
SRC和HREF來檢測是否存在可顯示的圖像文件,IMG
SRC表示「顯示下面的圖像文件」,而HREF則表示「下面是一個鏈接」,這兩種標簽經常導向一個圖像文件。搜索引擎通過檢查文件擴展名來判斷鏈接的是否是圖像文件。如果文件擴展名是.GIF或.JPG,那它就是一個可顯示的圖像。
2、人工干預找出圖像並進行分類:即人工對網上的圖像及站點進行選擇。這種方法可以產生准確的查詢體系,但勞動強度太大,限制了處理圖像的數量。由於圖像不同於文本,需要人們按照各自的理解來說明其蘊含的意義,因此圖像檢索比起文本的查詢和匹配要困難得多。目前的圖像搜索引擎大多支持關鍵詞檢索和分類瀏覽兩種檢索方式,部分可提供可視屬性檢索,但也很有限。它們主要的檢索途徑有以下幾種:
a.
基於圖像外部信息:即根據圖像的文件名或目錄名、路徑名、鏈路、ALT標簽以及圖像周圍的文本信息等外部信息進行檢索,這是目前圖像搜索引擎採用最多的方法。在找出圖像文件後,圖像搜索引擎通過查看文件名或路徑名確定文件內容,但這取決於文件名或路徑名的描述程度。
b.
基於圖像內容特徵描述:這是一種語義層次的匹配。需要人工對圖像的內容(如物體、背景、構成、顏色特徵等)進行描述並分類,給出描述詞。檢索時,將主要在這些描述詞中搜索你的檢索詞。這種查詢方式是比較准確的,一般來講可以獲得較好的查准率。但需人工參與,勞動強度大,因而限制了可處理的圖像數量,並且需要一定的規范和標准,效果取決於人工描述的精確度。
c.
基於圖像形式特徵的抽取:由圖像分析軟體自動抽取圖像的顏色、形狀、紋理等特徵,建立特徵索引庫,用戶只需將要查找的圖像的大致特徵描述出來,就可以找出與之具有相近特徵的圖像。這是一種基於圖像特徵層次的機械匹配,特別適用於檢索目標明確的查詢要求(例如對商標的檢索)。產生的結果也是最接近用戶要求的。但目前這種較成熟的檢索技術主要應用於圖像資料庫的檢索,在網上圖像搜索引擎中應用這種檢索技術還具有一定的困難
B. 百度圖片有什麼用啊 那些圖片和在百度直接搜索的有什
其實就是個網路賬號,可以有網路空間,傳圖片等等,也搜索得到,可以回復帖子,參與網路貼吧
C. 百度圖片搜索原理
不是,只是引用了原網頁中圖片的地址。
可以理解網頁是一張有布局的白紙,其中的圖片、視頻、音樂等多媒體文件是按照布局合理的「貼」到白紙上的。也就是說圖片文件和網頁本身是可分離的。圖片在網站目錄中有其單獨存在的文件。
D. 百度識圖有什麼用
網路識圖是網路圖片搜索推出的一項新功能。常規的圖片搜索,是通過輸入關鍵詞的形式搜索到互聯網上相關的圖片資源,而網路識圖則能實現用戶通過上傳圖片或輸入圖片的url地址,從而搜索到互聯網上與這張圖片相似的其他圖片資源,同時也能找到這張圖片相關的信息。識別人物、搜索服飾、尋找高清素材、瀏覽相似美圖,盡在網路識圖!
E. 百度圖片搜索引擎原理是如何實現的
圖片搜索的原理有三個步驟
1. 將目標圖片進行特徵提取,描述圖像的演算法很多,用的比較多的是:SIFT描述子,指紋演算法函數,bundling features演算法,hash function(散列函數)等。也可以根據不同的圖像,設計不同的演算法,比如圖像局部N階矩的方法提取圖像特徵。
2. 將圖像特徵信息進行編碼,並將海量圖像編碼做查找表。對於目標圖像,可以對解析度較大的圖像進行降采樣,減少運算量後在進行圖像特徵提取和編碼處理。
3. 相似度匹配運算:利用目標圖像的編碼值,在圖像搜索引擎中的圖像資料庫進行全局或是局部的相似度計算;根據所需要的魯棒性,設定閾值,然後將相似度高的圖片預保留下來;最後應該還有一步篩選最佳匹配圖片,這個應該還是用到特徵檢測演算法。
其中每個步驟都有很多演算法研究,圍繞數學,統計學,圖像編碼,信號處理等理論進行研究。
根據Neal Krawetz博士的解釋,原理非常簡單易懂。我們可以用一個快速演算法,就達到基本的效果。
這里的關鍵技術叫做"感知哈希演算法"(Perceptual hash algorithm),它的作用是對每張圖片生成一個"指紋"(fingerprint)字元串,然後比較不同圖片的指紋。結果越接近,就說明圖片越相似。下面是一個最簡單的實現:
第一步,縮小尺寸。
將圖片縮小到8x8的尺寸,總共64個像素。這一步的作用是去除圖片的細節,只保留結構、明暗等基本信息,摒棄不同尺寸、比例帶來的圖片差異。
第二步,簡化色彩。
將縮小後的圖片,轉為64級灰度。也就是說,所有像素點總共只有64種顏色。
第三步,計算平均值。
計算所有64個像素的灰度平均值。
第四步,比較像素的灰度。
將每個像素的灰度,與平均值進行比較。大於或等於平均值,記為1;小於平均值,記為0。
第五步,計算哈希值。
將上一步的比較結果,組合在一起,就構成了一個64位的整數,這就是這張圖片的指紋。組合的次序並不重要,只要保證所有圖片都採用同樣次序就行了。
得到指紋以後,就可以對比不同的圖片,看看64位中有多少位是不一樣的。在理論上,這等同於計算"漢明距離"(Hammingdistance)。如果不相同的數據位不超過5,就說明兩張圖片很相似;如果大於10,就說明這是兩張不同的圖片。
具體的代碼實現,可以參見Wote用python語言寫的imgHash.py。代碼很短,只有53行。使用的時候,第一個參數是基準圖片,第二個參數是用來比較的其他圖片所在的目錄,返回結果是兩張圖片之間不相同的數據位數量(漢明距離)。
這種演算法的優點是簡單快速,不受圖片大小縮放的影響,缺點是圖片的內容不能變更。如果在圖片上加幾個文字,它就認不出來了。所以,它的最佳用途是根據縮略圖,找出原圖。
實際應用中,往往採用更強大的pHash演算法和SIFT演算法,它們能夠識別圖片的變形。只要變形程度不超過25%,它們就能匹配原圖。這些演算法雖然更復雜,但是原理與上面的簡便演算法是一樣的,就是先將圖片轉化成Hash字元串,然後再進行比較。
F. 百度搜索網站帶圖片展示的功能是如何實現的
這個是搜索引擎抓取的,你在網路站長工具就可以得到答案
1、現在帶圖片有兩種一種是網站的logo 屬於這樣的
申請地址:http://zhanzhang..com/site/property
2、是網頁通用性的,這個是隨機抓取的。具體看如下文字
(1).網路會自動從文章中抓取圖片,協議規范以後提出。也就是說,現在網路的這種功能尚在測試當中,功能的實現尚未達到期望水平,需要進一步的改進與完善。
(2).圖片比例最好盡量符合121:75。因為網路搜索結果中的圖片解析度絕大多數為121:75,網路既然要提高用戶體驗,那就一定會在乎頁面的質量,盡量使抓取的圖片不變形並維持原貌,最好的做法就是抓取近似比例的圖片。
(3).圖片要和頁面內容緊密相關,這也體現了網路提出此項功能的用意,讓用戶更直觀識別此搜索項的內容,如果違反這個原則的話,網站將會受到相應的處罰,如屏蔽出圖、降低站內url排名、嚴重者整站將受到影響。