JavaScript實(shí)現(xiàn)文本相似度對(duì)比
一、發(fā)現(xiàn)問題
在開發(fā)過程中,難免會(huì)使用到2個(gè)(多個(gè))文本內(nèi)容處理,一是便于宏觀知道文本的重合度,而是更好的區(qū)分文本的創(chuàng)新度,也能更好的避免出現(xiàn)大篇幅復(fù)制。
為此,可以通過2個(gè)文本的相似度對(duì)比來實(shí)現(xiàn)業(yè)務(wù)需求。
二、解決問題
如果使用后端語言1來處理,就需要調(diào)取接口,對(duì)比少量的短文本可以實(shí)現(xiàn),但是一旦遇到在界面實(shí)現(xiàn)多個(gè)文本對(duì)比,并且篇幅巨多,再通過接口可能就出現(xiàn)耗時(shí)特別長(zhǎng)的情況。既然如此,但不如直接使用前端來處理。
使用算法:編輯距離。
1、編輯距離的概念
設(shè)A和B是兩個(gè)字符串,使用最少的字符操作將字符串A轉(zhuǎn)換為B。字符操作包括:(1)刪除一個(gè)字符;(2)插入一個(gè)字符;(3)將一個(gè)字符改寫為另一個(gè)字符。將字符串A變換為字符串B所需要的最少字符操作數(shù)稱為字符串A到字符串B的編輯距離(Edit Distance)
2、測(cè)試文本
舉例,文字來自網(wǎng)絡(luò)。
北京商報(bào)訊(記者 魏蔚)1月21日,交通運(yùn)輸部官方微信公眾號(hào)披露,1月20日上午,交通運(yùn)輸新業(yè)態(tài)協(xié)同監(jiān)管部際聯(lián)席會(huì)議辦公室對(duì)滿幫、貨拉拉、滴滴貨運(yùn)、快狗打車等4家互聯(lián)網(wǎng)道路貨運(yùn)平臺(tái)公司進(jìn)行約談,對(duì)滴滴出行、曹操出行、T3出行、美團(tuán)出行等4家網(wǎng)約車平臺(tái)公司進(jìn)行提醒。
智通財(cái)經(jīng)APP獲悉,1月20日,交通運(yùn)輸新業(yè)態(tài)協(xié)同監(jiān)管部際聯(lián)席會(huì)議辦公室對(duì)滿幫、貨拉拉、滴滴貨運(yùn)、快狗打車等4家互聯(lián)網(wǎng)道路貨運(yùn)平臺(tái)公司進(jìn)行約談,對(duì)滴滴出行、曹操出行、T3出行、美團(tuán)出行等4家網(wǎng)約車平臺(tái)公司進(jìn)行提醒。
3、代碼實(shí)現(xiàn)
實(shí)現(xiàn)代碼如下,最后返回的數(shù)據(jù)邏輯可以自行修改。
/**
* 相似度對(duì)比
* @param s 文本1
* @param t 文本2
* @param f 小數(shù)位精確度,默認(rèn)2位
* @returns {string|number|*} 百分?jǐn)?shù)前的數(shù)值,最大100. 比如 :90.32
*/
function similar(s, t, f) {
if (!s || !t) {
return 0
}
if(s === t){
return 100;
}
var l = s.length > t.length ? s.length : t.length
var n = s.length
var m = t.length
var d = []
f = f || 2
var min = function (a, b, c) {
return a < b ? (a < c ? a : c) : (b < c ? b : c)
}
var i, j, si, tj, cost
if (n === 0) return m
if (m === 0) return n
for (i = 0; i <= n; i++) {
d[i] = []
d[i][0] = i
}
for (j = 0; j <= m; j++) {
d[0][j] = j
}
for (i = 1; i <= n; i++) {
si = s.charAt(i - 1)
for (j = 1; j <= m; j++) {
tj = t.charAt(j - 1)
if (si === tj) {
cost = 0
} else {
cost = 1
}
d[i][j] = min(d[i - 1][j] + 1, d[i][j - 1] + 1, d[i - 1][j - 1] + cost)
}
}
let res = (1 - d[n][m] / l) *100
return res.toFixed(f)
}4、相似度對(duì)比結(jié)果
根據(jù)測(cè)試文本對(duì)比,結(jié)果為:
75.00
到此這篇關(guān)于JavaScript實(shí)現(xiàn)文本相似度對(duì)比的文章就介紹到這了,更多相關(guān)js文本相似度內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
javascript阻止scroll事件多次執(zhí)行的思路及實(shí)現(xiàn)
阻止scroll事件多次執(zhí)行主要是為了解決一些常見網(wǎng)頁特效在js解析時(shí)預(yù)期與效果不同,感興趣的朋友可以了解下2013-11-11
微信jssdk踩坑之簽名錯(cuò)誤invalid signature
這篇文章主要介紹了微信jssdk踩坑之簽名錯(cuò)誤invalid signature,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-05-05
javascript 實(shí)現(xiàn)的完全兼容鼠標(biāo)滾軸縮放圖片的代碼
以前看到的都是用IE的zoom,所以非IE就不支持,昨天看到這個(gè)js中鼠標(biāo)滾輪事件詳解 ,于是完全兼容(IE6-8,FF,Chrome,Opera,Safari)的鼠標(biāo)滾軸縮放圖片效果今天就誕生了2010-02-02
JavaScript實(shí)現(xiàn)合并(歸并)排序算法示例解析
這篇文章主要為大家介紹了JavaScript實(shí)現(xiàn)合并(歸并)排序算法示例解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-08-08
console.log()與console.dir()的區(qū)別及說明
這篇文章主要介紹了console.log()與console.dir()的區(qū)別及說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-01-01
Javascript立即執(zhí)行函數(shù)(IIFE)實(shí)例詳解
IIFE全拼Imdiately?Invoked?Function?Expression,是一個(gè)在定義的時(shí)候就立即執(zhí)行的JavaScript函數(shù),這篇文章主要給大家介紹了關(guān)于Javascript立即執(zhí)行函數(shù)的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-04-04
livereload工具實(shí)現(xiàn)前端可視化開發(fā)【推薦】
本文將介紹一個(gè)工具--livereload。這是一款能根據(jù)你本地文件(html、css、js)的變化,自動(dòng)跟蹤刷新瀏覽器的實(shí)時(shí)刷新工具,有了這個(gè)工具,會(huì)大大減輕你刷新頁面的工作量。下面跟著小編一起來看下吧2016-12-12

