久久久18,天天躁夜夜躁狠狠躁婷婷,国产成人三级一区二区在线观看一,最近的2019中文字幕视频 ,最新免费av在线观看

a&s專業(yè)的自動化&安全生態(tài)服務(wù)平臺
公眾號
安全自動化

安全自動化

安防知識網(wǎng)

安防知識網(wǎng)

手機站
手機站

手機站

大安防供需平臺
大安防供需平臺

大安防供需平臺

資訊頻道橫幅A1
首頁 > 資訊 > 正文

“以圖搜圖”的奇葩用途

你在什么時候會用圖搜圖?
  你在什么時候會用圖搜圖?

  當你感到語言蒼白無力的時候。

  你在掃街的時候,突然發(fā)現(xiàn)某撩妹達人穿了一身炫酷的T恤。

  你收到朋友送來的生猛紅酒,好奇這到底是百年窖藏還是山寨葡萄糖。

  你在編輯文案的時候,一張非常適合的圖片卻掛著水印,你需要一個清晰的版本(請支持正版。。。)

  以圖搜圖就像一個“癢癢撓”,能夠到文字搜索難以企及的癢點。這讓我們對這種搜索方式的結(jié)果抱有很高的期待。它讓很多人能透過互聯(lián)網(wǎng)的森林,感受到若隱若現(xiàn)的人工智能靈魂。這可能正是人們對這種技術(shù)好奇的原因。

  

  【圖像識別的應(yīng)用場景】

  和這種技術(shù)為伴十多年的陳杰博士,是博云視覺的CEO。他帶領(lǐng)北大團隊研發(fā)的圖像識別技術(shù)如今被用在百度和微信的圖像搜索和圖像識別場景中。他為雷鋒網(wǎng)(搜索“雷鋒網(wǎng)”公眾號關(guān)注)詳細介紹了圖像識別的一個重要門派——基于尺度空間理論的視覺搜索。

  

  【陳杰】

  視覺的秘密

  人的視覺原理很簡單:物體反射自然光在眼中成像。

  如果面前是一面巨大的白墻,你很難看出其中的細節(jié)。但是如果在墻面上畫了一只鳥,你一眼就可以分辨出來。

  你之所以能看到眼前這個鳥,是因為你的視覺認為它是一個“斑點”。通俗來講,就是某個東西和周圍的物體產(chǎn)生了反差。

  陳杰如此解釋視覺的原理。

  所以在你的眼中,眼前的場景是由一些“刺激點”組成的。這些便是圖像的“特征點”。而如果機器能夠和人一樣準確地識別兩張圖片中相同的“特征點”,就可以實現(xiàn)以圖搜圖這種高科技了。

  但對于人眼來說易如反掌的刺激點,怎么用機器語言記錄呢?

  陳杰告訴雷鋒網(wǎng),在機器眼中,每一個特征點都會被記錄為描述性的數(shù)據(jù),這些數(shù)據(jù)包括像素矩陣,顏色、紋理、梯度、形狀分布等

  在博云視覺的算法中,每張圖片會被提取1000個左右的特征點,而這些特征數(shù)據(jù)的大小約為 2Kb-4Kb。

  雖然背后的算法極其精細,但是粗略來說,對數(shù)據(jù)庫中的每張照片提取特征之后,圖像搜索就可以開始了。

  用戶提交搜索的查詢圖片,系統(tǒng)會自動提取圖片上的特征點,再用特征點和數(shù)據(jù)庫中的圖片特征做對比,兩個圖片的特征點匹配越多,系統(tǒng)就認為兩張圖片最為相似。于是,用戶會得到一個

  按照相似度排序的搜索結(jié)果列表。

  陳杰說,“一般兩張圖片擁有10個匹配的特征點,我們就可以認為他們是相似圖片。”

  警察叔叔的利器

  一般童鞋可能想不到,這個高科技解放了警察叔叔。

  對于重大案件來說,嫌疑人的汽車往往是破案的重要線索。于是如何從數(shù)以億計的監(jiān)控圖像中找出某個特定汽車,成為了警察叔叔的噩夢。

  以往的方法是:警察叔叔們趴在電腦前,連續(xù)看上一兩個月監(jiān)控視頻,才能基本找到所有包含目標汽車的監(jiān)控圖像。(由于汽車的移動,所以一般會在多個監(jiān)控圖像中發(fā)現(xiàn)目標。)

  但是如果使用圖像識別技術(shù),只要依靠一張樣本,就可以在幾小時之內(nèi),基本找到所有目標圖像。

  陳杰告訴雷鋒網(wǎng),在和某地公安的聯(lián)合實驗中,在搜索結(jié)果的前200位中,包含了正確結(jié)果的90%。也就是說:如果目標共出現(xiàn)在50張圖片中,那么在前200位結(jié)果中包含45個。

  

  【利用監(jiān)控圖片搜索指定汽車】

  “增強現(xiàn)實”的工具

  但是,一輛車一定是以各個角度和姿態(tài)出現(xiàn)在監(jiān)控圖像中,那么識別系統(tǒng)為什么可以做出相對準確的識別呢?

  陳杰表示,使用這種技術(shù)做圖像識別,需要面對三個重要的干擾因素:

  光照

  由于同一個物體在不同光線下,特征點的像素呈現(xiàn)出的數(shù)據(jù)會有很大的差異。所以好的算法必須能夠排除光線的干擾,提取物特征點最基礎(chǔ)的信息。但是不可否認,在極端弱光(例如黑夜)或者極端復(fù)雜光線(例如酒吧)下,特征的辨識力會降低。

  幾何變換

  一輛汽車從各個角度來看,有很大的區(qū)別。根據(jù)物體的拍攝角度不同,特征信息一定會發(fā)生變化。然而人眼仍然能夠識別出兩個不同角度的圖像是同一物體。對于機器識別系統(tǒng)來說,則需要根據(jù)不同的角度變換進行計算,這樣就能盡可能做到物體平移、旋轉(zhuǎn)等幾何變換之后依然可以進行準確匹配。

  距離

  如果物體在畫面中位置過遠,就會變得更小,這樣圖像上的細節(jié)就會大量丟失。這樣的話,一張近視圖和遠視圖就很難被機器認定為相似。為了解決這個問題,陳杰和團隊采用了一種基于尺度空間理論的方法:將每張圖片以不同的量級進行高斯模糊,這個動作是為了模擬人眼在不同距離看到的物體。在這些模糊圖片進行特征提取和比對,就可以匹配距離鏡頭不同距離的同一物體。

  解決了“距離”這個棘手的問題,這種圖像識別的方法就可以完美地應(yīng)用在增強現(xiàn)實的游戲中。在這種情況下,應(yīng)用場景往往是預(yù)設(shè)而且固定的,所以游戲的提供商可以把真實的場景通過拍攝不同角度和遠近的照片,然后錄入數(shù)據(jù)庫。玩家在進行游戲的時候,會佩戴帶有攝像頭的眼鏡,這種情況下,圖像識別系統(tǒng)就可以對玩家眼中的“景物”和數(shù)據(jù)庫中的圖片匹配,理解玩家的具體位置,從而在眼鏡中加入各種奇幻的特效

  蕾絲邊的福音

  你知道蕾絲嗎?我自己都沒有想到這個技術(shù)可以用于蕾絲制造行業(yè)。

  陳杰說。

  有一個專門做蕾絲花紋搜索引擎的團隊找到陳杰,告訴他一個行業(yè)的痛點:蕾絲生產(chǎn)廠家經(jīng)常生產(chǎn)一些特定的類似花紋,尋求買家。但是蕾絲的花紋通常根本無法用人類的語言來形容,所以經(jīng)常可以看到有人在微信群里發(fā)很多圖片,詢問是否有人需要這個樣式;對于買家來說,他們也會發(fā)圖片,并且詢問是否有人有這樣的花紋。

  這種情況下這個蕾絲花紋搜索引擎就出現(xiàn)了,它對接了買家和賣家。這種搜索引擎,需要的恰恰是這種圖像識別技術(shù)。

  以驢找驢vs以驢找馬

  圖像識別同樣可以拯救紅酒控。

  陳杰告訴雷鋒網(wǎng),博云視覺服務(wù)的客戶中,就有一個專門幫用戶識別酒標的 App。“這個團隊擁有一個巨大的酒標數(shù)據(jù)庫。可以通過拍照搜索的方式,獲得很多奇特紅酒的詳細信息。”

  尋找酒標是尺度空間理論圖像識別的典型應(yīng)用方式。因為它符合一個一個規(guī)則:在數(shù)據(jù)庫中找到完全相同的圖片/物體。用通俗的話來說,就是“以驢找驢”。而在我們的搜索需求中, 還存在一種“以驢找馬”的需求,它的目的是搜索相似圖片/物體。

  【各類紅酒標】

  陳杰告訴雷鋒網(wǎng),以驢找馬這種需求,目前更多地使用區(qū)別于“尺度空間理論識別”的“機器學(xué)習”的技術(shù)路線,這也是普通人更熟悉的一種技術(shù)。

  機器學(xué)習,主要原理是給一個運算力強大的計算機群學(xué)習大量的數(shù)據(jù),然后讓機器提取出這一類素材的內(nèi)部規(guī)律,用這類規(guī)律幫人類工作。例如不久前戰(zhàn)敗李世石的阿法狗,使用的就是機器學(xué)習的方式。

  【以驢找驢的搜索方式,可以更好地發(fā)現(xiàn)完全一致的圖像結(jié)果】

  這種技術(shù)在資源充足的情況下,后期會出現(xiàn)驚人的能力。但是它需要兩個重要的因素:

  1、用來“喂養(yǎng)”系統(tǒng)的巨大數(shù)據(jù)樣本

  2、超高的計算能力,超長的計算時間,超大的存儲空間。

  “這種技術(shù)就像火箭發(fā)射,需要足夠的燃料(數(shù)據(jù))和強大的發(fā)動機(計算機性能)”陳杰說,

  所以在很多場景中, “尺度空間識別”和“機器學(xué)習識別”需要結(jié)合起來,才能產(chǎn)生最優(yōu)的效果。

  有一點確定無疑,那就是隨著圖像識別領(lǐng)域的技術(shù)爆發(fā),這種“解癢”的技術(shù)究竟可以用來解決很多具體的問題。正如“蕾絲邊問題”一樣,在很多情況下,沒有人會把這種技術(shù)和具體的問題聯(lián)系起來。

  或者說:對科技的魔力,我們?nèi)匀汇氯粺o知。

參與評論
回復(fù):
0/300
文明上網(wǎng)理性發(fā)言,評論區(qū)僅供其表達個人看法,并不表明a&s觀點。
0
關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺,自1994年品牌成立以來,一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化,a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗,提供媒體、活動、展會等整合營銷服務(wù)。

免責聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請聯(lián)系我們,本站核實后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟賠償!敬請諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權(quán)所有 粵ICP備12072668號 粵公網(wǎng)安備 44030402000264號
用戶
反饋