利用JS實(shí)現(xiàn)一個(gè)同Excel表現(xiàn)的智能填充算法
前言
本文介紹了關(guān)于利用JS實(shí)現(xiàn)同Excel表現(xiàn)的智能填充算法的相關(guān)內(nèi)容,分享出供大家參考學(xué)習(xí),下面話不多說了,來一起看看詳細(xì)的介紹吧

在使用Excel的時(shí)候,發(fā)現(xiàn)它的“智能填充”功能非常有趣,能夠智能地分析我當(dāng)前的內(nèi)容,然后準(zhǔn)確預(yù)測出我期望得到的值。排除了AI的加成,發(fā)現(xiàn)這個(gè)功能其實(shí)也可以通過數(shù)學(xué)理論和簡單代碼來實(shí)現(xiàn)。經(jīng)過一番折騰,終于用JS實(shí)現(xiàn)了大致的功能,然后我把它名為smart-predictor。
項(xiàng)目地址:https://github.com/jrainlau/s...(本地下載)
什么是“智能填充”?
首先我們來看兩張gif圖:


是不是很神奇?假設(shè)我有一組給定的數(shù)據(jù)[1, 3, 'aaa1', 'bbb2'] ,Excel的智能填充能夠給我返回[5, 7, 'aaa2', 'bbb3', 9, 11 'aaa3', 'bbb4']這一組數(shù)據(jù)。
更厲害的是,智能填充不是簡單地對數(shù)據(jù)進(jìn)行遞增,而是會(huì)對數(shù)據(jù)進(jìn)行分組,每個(gè)分組按照自己的規(guī)則去進(jìn)行遞增,就比如說我們可以從[1, 2, 'x', 3]得到[3, 4, 'x', 4] 。
在明白這些結(jié)論之后,我們就可以去討論它到底是怎么實(shí)現(xiàn)的。
Separator
我們用數(shù)組[1, 2, 'a1c', 'a2c']作為例子。當(dāng)我們拿到這樣一個(gè)數(shù)組的時(shí)候,第一步是要對其進(jìn)行分析,分析數(shù)組內(nèi)每個(gè)元素到底是一個(gè)數(shù)字,一段字符串,還是別的什么東西。分析完了,就要給他們都標(biāo)注更詳細(xì)的信息,然后把這些信息都組合起來。
比如數(shù)組元素1,可以被處理成下面這個(gè)樣子:
{
realValue: 1,
numericValue: 1,
splitParts: 'Number',
index: 0
}
而數(shù)組元素a1c,則可以處理成這樣:
{
realValue: 'a1c',
numericValue: 1,
splitParts: ['a', 'c'],
index: 2
}
代碼請戳:separator.js
可以注意到,我會(huì)提取每一個(gè)元素的純數(shù)字部分出來,然后把其余部分通過一個(gè)數(shù)組儲(chǔ)存起來。這一切就是Separator所做的工作,我們最終會(huì)得到一個(gè)富含信息的新數(shù)組,然后繼續(xù)我們的工作吧!
Classifier
智能填充的最小單位是“組”。當(dāng)我們通過上一步得到一個(gè)富含信息的新數(shù)組之后,接下來就應(yīng)該對它們進(jìn)行合理的分組。分組的動(dòng)作包含了兩個(gè)細(xì)節(jié):
- 同一組的數(shù)據(jù)應(yīng)該擁有一致的“類型”,這里我們使用splitParts屬性去實(shí)現(xiàn)。
- 同一組的數(shù)據(jù)應(yīng)該是連續(xù)的,否則的話就要把不連續(xù)的數(shù)據(jù)扔到一個(gè)新的組去。
假設(shè)有一個(gè)數(shù)組[1, 2, 'a1c', 'a2c', 6, 8],元素1和2就應(yīng)該被分配到名為Number的組去,a1c和a2c則會(huì)被分配到名為ac的組里面,而6和8則會(huì)被另外分配到名為Number1的新組里面去,最后結(jié)果如下:
{
'Number': [{
realValue: '1',
...
}, {
realValue: '2',
...
}],
'ac': [{
realValue: 'a1c',
...
}, {
realValue: 'a2c',
...
}],
'Number1': [{
realValue: '6',
...
}, {
realValue: '8',
...
}]
}
代碼請戳:classifier.js
通過上述步驟,我們成功把數(shù)據(jù)進(jìn)行分組,組與組之間的元素并不會(huì)相互干擾。接下來我們需要實(shí)現(xiàn)一個(gè)專門做“線性回歸”的方法,有了這個(gè)方法我們才能對數(shù)據(jù)進(jìn)行“預(yù)測”。
Linear regression
“線性回歸”是一個(gè)數(shù)學(xué)理論,詳情請自己google之,這里我直接使用線性回歸的二元一次公式去求得回歸直線的斜率:
y = ax + b
a = ∑(x−x')(y−y') / ∑(x−x')(x−x')
其中x'是所有點(diǎn)x坐標(biāo)的平均數(shù),同樣的,y'是所有點(diǎn)y坐標(biāo)的平均數(shù)。
代碼請戳:linearRegression.js
通過這條公式,我們可以輕易得到數(shù)組[1, 3]的斜率和偏移量為{ a: 2, b:1 },然后就可以知道以后的數(shù)據(jù)走向?qū)?huì)是[5, 7, 9, ...]。
這就是整一個(gè)“智能填充”的核心原理,接下來我們就可以依靠這個(gè)原理去實(shí)現(xiàn)數(shù)據(jù)的預(yù)測了。
Predictor
借助線性回歸的力量,我們可以通過設(shè)置預(yù)測的次數(shù),挨個(gè)挨個(gè)地對每一個(gè)分組數(shù)據(jù)進(jìn)行預(yù)測,然后再把它們組合到一起形成一個(gè)新的結(jié)果數(shù)組。
以上文Classifier中的分組數(shù)據(jù)為例,對它預(yù)測一次,結(jié)果如下:
{
'Number': [{
realValue: '1',
index: 0,
...
}, {
realValue: '2',
index: 1,
...
}, {
realValue: '3',
index: 6,
...
}, {
realValue: '4',
index: 7,
...
}],
'ac': [{
realValue: 'a1c',
index: 2,
...
}, {
realValue: 'a2c',
index: 3,
...
}, {
realValue: 'a3c',
index: 8,
...
}, {
realValue: 'a4c',
index: 9,
...
}],
'Number1': [{
realValue: '6',
index: 4,
...
}, {
realValue: '8',
index: 5
...
}, {
realValue: '10',
index: 10,
...
}, {
realValue: '12',
index: 11
...
}]
}
代碼請戳:predictor.js
由于我們知道每一個(gè)數(shù)據(jù)的下標(biāo),所以我們可以簡單又準(zhǔn)確地把它們放到正確的位置去,最后輸出如下:
[1, 2, 'a1c', 'a2c', 6, 8, 3, 4, 'a3c', 'a4c', 10, 12]
接下來我們可以來看看測試用例對比Excel表現(xiàn):

More
當(dāng)前的smart-predictor仍然不夠“smart”,它只能預(yù)測自然數(shù)字,或者自然數(shù)字與字符串的結(jié)合,但仍然不支持對日期格式,字母列表等數(shù)據(jù)的預(yù)測。如果各位讀者有興趣,也非常歡迎大家來貢獻(xiàn)腦洞,讓smart-predicotr變得更加智能。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
相關(guān)文章
Layui 導(dǎo)航默認(rèn)展開和菜單欄選中高亮設(shè)置的方法
今天小編就為大家分享一篇Layui 導(dǎo)航默認(rèn)展開和菜單欄選中高亮設(shè)置的方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-09-09
符合W3C Web標(biāo)準(zhǔn)的圖片連續(xù)無間隙水平滾動(dòng)
很久以前就有這個(gè)問題,總是找不到通用的,或比較簡單的“圖片連續(xù)無間隙向左滾動(dòng),無間隙向右滾動(dòng),符合W3C Web標(biāo)準(zhǔn)”2008-06-06
Bootstrap每天必學(xué)之模態(tài)框(Modal)插件
Bootstrap每天必學(xué)之模態(tài)框(Modal)插件,模態(tài)框(Modal)是覆蓋在父窗體上的子窗體。通常,目的是顯示來自一個(gè)單獨(dú)的源的內(nèi)容,可以在不離開父窗體的情況下有一些互動(dòng)。子窗體可提供信息、交互等,感興趣的小伙伴們可以參考一下2016-04-04
關(guān)于javascript函數(shù)的幾個(gè)話題
關(guān)于javascript函數(shù)的幾個(gè)話題...2007-03-03
javascript中解析四則運(yùn)算表達(dá)式的算法和示例
這篇文章主要介紹了javascript中解析四則運(yùn)算表達(dá)式的算法和示例,本文介紹了中綴表示法、逆波蘭表示法這2種算法,并分別給出了代碼實(shí)例,需要的朋友可以參考下2014-08-08

