python下利用有利用css的font-family屬性來提取html字符串的庫嗎?用來做字體子集化。
你問的問題有一點(diǎn)模糊,若是使用CSS Selector取html內(nèi)的內(nèi)容,可以用lxml.cssselect,中文說明還有這有,且不只是用lxml
font-family只是指定使用的字體。
你想做的是對一篇HTML計(jì)算一共有多少個(gè)漢字,然后動(dòng)態(tài)或者半靜態(tài)生成只包含這些字的提及比較小的漢字字體遠(yuǎn)程下載使用?
如果只是計(jì)算漢字,其實(shí)python下面的set是最簡單的。
但是要生成對應(yīng)的字庫就是大坑了。目前方正有類似的服務(wù),似乎叫云字庫,之前詢過價(jià),對方老實(shí)表示問題還不少。