国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

字符串 - PHP短文本匹配的排序算法
高洛峰
高洛峰 2017-04-10 15:04:14
0
1
382

PHP做簡(jiǎn)單的短文本搜索匹配時(shí),我用的是最長(zhǎng)公共子序列。但是如果關(guān)鍵字匹配到兩條文本的相似度一樣時(shí),如何將兩條文本中關(guān)鍵字更靠前的返回?舉例:關(guān)鍵字“無(wú)”匹配到“無(wú)雙”和“虛無(wú)”,我要如何在返回的結(jié)果中把“無(wú)雙”排在“虛無(wú)”前面?那“無(wú)雙”匹配到的“無(wú)小明的雙”和“小明無(wú)的雙”呢?

<?php
$names = array(
  '真三國(guó)無(wú)雙',
  '無(wú)雙劍姬',
  '虛無(wú)',
  '一時(shí)無(wú)兩',
  '南無(wú)阿彌陀佛',
  '崖山之后無(wú)中國(guó)',
);

//拆分詞語(yǔ)為單個(gè)字符
function split_name($name) {
  preg_match_all("/./u", $name, $arr);
  return $arr[0];
}

//最長(zhǎng)公共子序列
function LCS($str_1, $str_2) {
  $len_1 = strlen($str_1);
  $len_2 = strlen($str_2);
  $len = $len_1 > $len_2 ? $len_1 : $len_2;

  $dp = array();
  for ($i = 0; $i <= $len; $i++) {
    $dp[$i] = array();
    $dp[$i][0] = 0;
    $dp[0][$i] = 0;
  }

  for ($i = 1; $i <= $len_1; $i++) {
    for ($j = 1; $j <= $len_2; $j++) {
      if ($str_1[$i - 1] == $str_2[$j - 1]) {
        $dp[$i][$j] = $dp[$i - 1][$j - 1] + 1;
      } else {
        $dp[$i][$j] = $dp[$i - 1][$j] > $dp[$i][$j - 1] ? $dp[$i - 1][$j] : $dp[$i][$j - 1];
      }
    }
  }

  return $dp[$len_1][$len_2];
}

function search($name) {
  Global $names;

  $sort_list = array();
  if (mb_strlen($name, 'utf-8') != strlen($name)) { // 是否全英文字符
    $arr_1 = array_unique(split_name($name));
    foreach ($names as $value) {
      $arr_2 = array_unique(split_name($value));
      $similarity = count($arr_2) - count(array_diff($arr_2, $arr_1));
      $sort_list[$value] = $similarity;
    }
  } else {
    foreach ($names as $value) {
      $similarity = LCS($name, $value);
      $sort_list[$value] = $similarity;
    }
  }
  arsort($sort_list);

  return $sort_list;
}

header('content-type:text/html;charset=utf-8');
print_r(search('無(wú)'));
高洛峰
高洛峰

擁有18年軟件開(kāi)發(fā)和IT教學(xué)經(jīng)驗(yàn)。曾任多家上市公司技術(shù)總監(jiān)、架構(gòu)師、項(xiàng)目經(jīng)理、高級(jí)軟件工程師等職務(wù)。 網(wǎng)絡(luò)人氣名人講師,...

reply all(1)
Ty80

所以你只是想讓搜索結(jié)果中字在前的排名越前咯?那不就直接把所有匹配到的字的位置相加越小的不就在前面么?不知道我理解錯(cuò)沒(méi)有... 代碼在線運(yùn)行:http://3v4l.org/K0X7m

<?php
/** 初始化設(shè)置查詢關(guān)鍵詞和查詢內(nèi)容 **/
$names = array(
  '真三國(guó)無(wú)雙',
  '無(wú)雙劍姬',
  '虛無(wú)',
  '一時(shí)無(wú)兩',
  '南無(wú)阿彌陀佛',
  '崖山之后無(wú)中國(guó)',
);
$search = array("無(wú)","雙");

/** 劈開(kāi)字符串 **/
$res = array();
foreach($names as $name) {
    preg_match_all("/./u", $name, $match);
    $res[$name]['single'] = $match[0];
}

/** 對(duì)字符串進(jìn)行遍歷,存儲(chǔ)匹配到的位置,對(duì)沒(méi)有匹配到所有的關(guān)鍵詞的字符串剔除,匹配到所有的將位置相加,越小的排名越靠前 **/
foreach($res as $name => $v) {
    $pos = array();
    foreach($v['single'] as $k => $s) {
        if(in_array($s, $search)) $pos[$s][] = $k;
    }
    if(count($pos) != count($search)) {
        unset($res[$name]);
    } else {
        $seq = 0;
        array_walk_recursive($pos, function($i) use(&$seq) {
            $seq += $i;
        });
        $res[$name] = $seq;
    }
}

ksort($res);
$res = array_keys($res);

var_dump($res);
Latest Downloads
More>
Web Effects
Website Source Code
Website Materials
Front End Template