批處理從html格式(接收到的郵件)中讀取數(shù)據(jù)的操作方法
通過第三方批處理getmail可以獲取到郵箱里的郵件。獲取后經(jīng)其自身解碼,得到一個Extract*.out文件,大致看一下其格式應(yīng)該為html的寫法,并且內(nèi)容只分一行。
<div dir="auto">here is the content</div>
顯然我郵件發(fā)送的原內(nèi)容為:
here is the content
現(xiàn)在要提取出其中的原內(nèi)容并且將所有內(nèi)容合并到一行。問題在于,郵箱不一定每次都接收到這樣簡單的文件。例如內(nèi)容當(dāng)中出現(xiàn)換行:
<div dir="auto">abababababababab<br /><br />abababababababab<br /><br /></div>
有時(shí)內(nèi)容含特殊字符,解碼之后也無法正常顯示(某些字符):
i wanna get these words # $ % & * @ ? !
<div dir="auto">i wanna get these words # $ % & * @ ? !</div>
有時(shí)發(fā)送的內(nèi)容經(jīng)過復(fù)制粘貼,不小心留下了其他信息:
<div dir="auto">hey get it <span style="font-family:sans-serif">hey get it </span><br style="font-family:sans-serif" /><span style="font-family:sans-serif">hey get it </span><span style="font-family:sans-serif">hey get it </span><br style="font-family:sans-serif" /></div>
顯然需要忽略<>標(biāo)簽里的所有內(nèi)容才能得到原內(nèi)容,并且需要還原未正常顯示的符號。
可能要用到第三方了……
到此這篇關(guān)于批處理從html格式(接收到的郵件)中讀取數(shù)據(jù)的操作方法的文章就介紹到這了,更多相關(guān)批處理html格式讀取數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
bat運(yùn)行時(shí)不彈出那個黑框框的完美解決方案
bat運(yùn)行時(shí)不彈出那個黑框框的完美解決方案...2006-12-12
通過批處理bat設(shè)置系統(tǒng)環(huán)境變量的實(shí)現(xiàn)代碼
這篇文章主要介紹了通過批處理bat設(shè)置系統(tǒng)環(huán)境變量的實(shí)現(xiàn)代碼,需要的朋友可以參考下2014-07-07
用批處理實(shí)現(xiàn)禁止運(yùn)行指定程序
原理就是通過修改注冊表來實(shí)現(xiàn)的,HKLM\SOFTWARE\Microsoft\Windows NT\CurrentVersion\Image File Execution Options2008-08-08

