python正則表達(dá)式面試題解答
三道python正則表達(dá)式面試題,具體如下
1.去除以下html文件中的標(biāo)簽,只顯示文本信息。
<div> <p>崗位職責(zé):</p> <p>完成推薦算法、數(shù)據(jù)統(tǒng)計、接口、后臺等服務(wù)器端相關(guān)工作</p> <p><br></p> <p>必備要求:</p> <p>良好的自我驅(qū)動力和職業(yè)素養(yǎng),工作積極主動、結(jié)果導(dǎo)向</p> <p> <br></p> <p>技術(shù)要求:</p> <p>1、一年以上 Python 開發(fā)經(jīng)驗,掌握面向?qū)ο蠓治龊驮O(shè)計,了解設(shè)計模式</p> <p>2、掌握HTTP協(xié)議,熟悉MVC、MVVM等概念以及相關(guān)WEB開發(fā)框架</p> <p>3、掌握關(guān)系數(shù)據(jù)庫開發(fā)設(shè)計,掌握 SQL,熟練使用 MySQL/PostgreSQL 中的一種<br></p> <p>4、掌握NoSQL、MQ,熟練使用對應(yīng)技術(shù)解決方案</p> <p>5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js</p> <p> <br></p> <p>加分項:</p> <p>大數(shù)據(jù),數(shù)理統(tǒng)計,機器學(xué)習(xí),sklearn,高性能,大并發(fā)。</p> </div>
利用python正則表達(dá)式re模塊中的sub方法,將標(biāo)簽替換為空字符串,代碼如下:
#-*- coding:utf-8 -*- import re #去除標(biāo)簽 s = "<div>\ <p>崗位職責(zé):</p>\ <p>完成推薦算法、數(shù)據(jù)統(tǒng)計、接口、后臺等服務(wù)器端相關(guān)工作</p>\ <p><br></p>\ <p>必備要求:</p>\ <p>良好的自我驅(qū)動力和職業(yè)素養(yǎng),工作積極主動、結(jié)果導(dǎo)向</p>\ <p> <br></p>\ <p>技術(shù)要求:</p>\ <p>1、一年以上 Python 開發(fā)經(jīng)驗,掌握面向?qū)ο蠓治龊驮O(shè)計,了解設(shè)計模式</p>\ <p>2、掌握HTTP協(xié)議,熟悉MVC、MVVM等概念以及相關(guān)WEB開發(fā)框架</p>\ <p>3、掌握關(guān)系數(shù)據(jù)庫開發(fā)設(shè)計,掌握 SQL,熟練使用 MySQL/PostgreSQL 中的一種<br></p>\ <p>4、掌握NoSQL、MQ,熟練使用對應(yīng)技術(shù)解決方案</p>\ <p>5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js</p>\ <p> <br></p>\ <p>加分項:</p>\ <p>大數(shù)據(jù),數(shù)理統(tǒng)計,機器學(xué)習(xí),sklearn,高性能,大并發(fā)。</p>\ </div> " p = r"</?\w+>| " print(re.sub(p, " ", s))
2.將以下網(wǎng)址提取出域名:
http://www.interoem.com/messageinfo.asp?id=35`
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415
利用sub方法,將整個字符串替換為只含域名的字符串。代碼如下:
#-*- coding:utf-8 -*- import re #提取出域名 s2 = """http://www.interoem.com/messageinfo.asp?id=35` http://3995503.com/class/class09/news_show.asp?id=14 http://lib.wzmc.edu.cn/news/onews.asp?id=769 http://www.zy-ls.com/alfx.asp?newsid=377&id=6 http://www.fincm.com/newslist.asp?id=415""" p = r"(http://.+?/).+" print(re.sub(p, lambda x : x.group(1), s2))
3.提取出如下字符串中的單詞:
hello world ha ha
利用split方法分割空格或者用findall方法尋找到所有的單詞,代碼如下:
#-*- coding:utf-8 -*- import re #提取出單詞 s3 = "hello world ha ha" print(re.split(r" +", s3)) print(re.findall(r"\b\w+\b", s3))
三道題運行結(jié)果如下:
第一題:
崗位職責(zé): 完成推薦算法、數(shù)據(jù)統(tǒng)計、接口、后臺等服務(wù)器端相關(guān)工作 必備要求: 良好的自我驅(qū)動力和職業(yè)素養(yǎng),工作積極主動、結(jié)果導(dǎo)向 技術(shù)要求: 1、一年以上 Python 開發(fā)經(jīng)驗,掌握面向?qū)ο蠓治龊驮O(shè)計,了解設(shè)計模式 2、掌握HTTP協(xié)議,熟悉MVC、MVVM等概念以及相關(guān)WEB開發(fā)框架 3、掌握關(guān)系數(shù)據(jù)庫開發(fā)設(shè)計,掌握 SQL,熟練使用 MySQL/PostgreSQL 中的一種 4、掌握NoSQL、MQ,熟練使用對應(yīng)技術(shù)解決方案 5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js 加分項: 大數(shù)據(jù),數(shù)理統(tǒng)計,機器學(xué)習(xí),sklearn,高性能,大并發(fā)。
第二題:
http://www.interoem.com/
http://3995503.com/
http://lib.wzmc.edu.cn/
http://www.zy-ls.com/
http://www.fincm.com/
第三題:
['hello', 'world', 'ha', 'ha']
['hello', 'world', 'ha', 'ha']
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
使用Python進(jìn)行數(shù)據(jù)清洗與存儲的基本方法
在爬蟲數(shù)據(jù)獲取完成后,數(shù)據(jù)往往是“原始”的,不適合直接使用,清洗和存儲是將爬取到的原始數(shù)據(jù)轉(zhuǎn)化為有用信息的關(guān)鍵步驟,本文將系統(tǒng)地介紹 Python 中進(jìn)行數(shù)據(jù)清洗與存儲的基本方法,幫助新手理解如何處理爬蟲數(shù)據(jù),使其更加適合分析和使用,需要的朋友可以參考下2024-11-11
Python內(nèi)置函數(shù)zip map filter的使用詳解
這篇文章主要介紹了Python內(nèi)置函數(shù)zip map filter的使用,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-04-04
tensorflow實現(xiàn)二維平面模擬三維數(shù)據(jù)教程
今天小編就為大家分享一篇tensorflow實現(xiàn)二維平面模擬三維數(shù)據(jù)教程,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02
python sqlobject(mysql)中文亂碼解決方法
在使用python寫項目的時候,用到了sqlobject庫函數(shù)connectionForURI連接mysql,但是遇到了中文顯示亂碼的問題,在添加記錄的時候還拋出異常2008-11-11

