參考:/a/1190000002497183
需求跟這個(gè)是類(lèi)似的 要求是能全文檢索(當(dāng)然是中文全文) 放進(jìn)去什么就能原樣拿出來(lái)什么
現(xiàn)在的問(wèn)題是 lucene也可以在索引的時(shí)候保持原字段內(nèi)容
那么綜合
*性能(不超過(guò)200次/s查詢)、
*更新(希望數(shù)據(jù)更新后立刻能反映出來(lái),但是檢索可以延遲)、
*數(shù)據(jù)量(小于千萬(wàn)級(jí),每條數(shù)據(jù)不會(huì)上M)
*擴(kuò)展性(多源、每個(gè)源的格式、字段不太一樣)
的考慮,需不需要把這個(gè)原始的數(shù)據(jù)存到數(shù)據(jù)庫(kù)里 然后lucene只留一個(gè)主鍵,還是直接從lucene還原原始數(shù)據(jù)更好呢
以前做過(guò)類(lèi)似項(xiàng)目是在mongo里存原始內(nèi)容 沒(méi)太考慮過(guò)這些
我只用過(guò)solr,不過(guò)感覺(jué)思路應(yīng)該是只用lucene作索引,存儲(chǔ)還是放在mogondb上面就行了,每次查詢的時(shí)候先查詢lucene,在根據(jù)主鍵從mongodb里面取數(shù)據(jù)