八個(gè)超級(jí)好用的Python自動(dòng)化腳本(小結(jié))
每天你都可能會(huì)執(zhí)行許多重復(fù)的任務(wù),例如閱讀新聞、發(fā)郵件、查看天氣、打開(kāi)書(shū)簽、清理文件夾等等,使用自動(dòng)化腳本,就無(wú)需手動(dòng)一次又一次地完成這些任務(wù),非常方便。而在某種程度上,Python 就是自動(dòng)化的代名詞。
1、自動(dòng)化閱讀網(wǎng)頁(yè)新聞
這個(gè)腳本能夠?qū)崿F(xiàn)從網(wǎng)頁(yè)中抓取文本,然后自動(dòng)化語(yǔ)音朗讀,當(dāng)你想聽(tīng)新聞的時(shí)候,這是個(gè)不錯(cuò)的選擇。
代碼分為兩大部分,第一通過(guò)爬蟲(chóng)抓取網(wǎng)頁(yè)文本呢,第二通過(guò)閱讀工具來(lái)朗讀文本。
需要的第三方庫(kù):
- Beautiful Soup - 經(jīng)典的HTML/XML文本解析器,用來(lái)提取爬下來(lái)的網(wǎng)頁(yè)信息
- requests - 好用到逆天的HTTP工具,用來(lái)向網(wǎng)頁(yè)發(fā)送請(qǐng)求獲取數(shù)據(jù)
- Pyttsx3 - 將文本轉(zhuǎn)換為語(yǔ)音,并控制速率、頻率和語(yǔ)音
import pyttsx3
import requests
from bs4 import BeautifulSoup
engine = pyttsx3.init('sapi5')
voices = engine.getProperty('voices')
newVoiceRate = 130 ? ? ? ? ? ? ? ? ? ? ? ## Reduce The Speech Rate
engine.setProperty('rate',newVoiceRate)
engine.setProperty('voice', voices[1].id)
def speak(audio):
? engine.say(audio)
? engine.runAndWait()
text = str(input("Paste article\n"))
res = requests.get(text)
soup = BeautifulSoup(res.text,'html.parser')
articles = []
for i in range(len(soup.select('.p'))):
? ? article = soup.select('.p')[i].getText().strip()
? ? articles.append(article)
text = " ".join(articles)
speak(text)
# engine.save_to_file(text, 'test.mp3') ## If you want to save the speech as a audio file
engine.runAndWait()2、自動(dòng)化數(shù)據(jù)探索
數(shù)據(jù)探索是數(shù)據(jù)科學(xué)項(xiàng)目的第一步,你需要了解數(shù)據(jù)的基本信息才能進(jìn)一步分析更深的價(jià)值。
一般我們會(huì)用pandas、matplotlib等工具來(lái)探索數(shù)據(jù),但需要自己編寫(xiě)大量代碼,如果想提高效率,Dtale是個(gè)不錯(cuò)的選擇。
Dtale特點(diǎn)是用一行代碼生成自動(dòng)化分析報(bào)告,它結(jié)合了Flask后端和React前端,為我們提供了一種查看和分析Pandas數(shù)據(jù)結(jié)構(gòu)的簡(jiǎn)便方法。
我們可以在Jupyter上實(shí)用Dtale。
需要的第三方庫(kù):Dtale - 自動(dòng)生成分析報(bào)告
### Importing Seaborn Library For Some Datasets
import seaborn as sns
### Printing Inbuilt Datasets of Seaborn Library
print(sns.get_dataset_names())
### Loading Titanic Dataset
df=sns.load_dataset('titanic')
### Importing The Library
import dtale
#### Generating Quick Summary
dtale.show(df)
3、自動(dòng)發(fā)送多封郵件
這個(gè)腳本可以幫助我們批量定時(shí)發(fā)送郵件,郵件內(nèi)容、附件也可以自定義調(diào)整,非常的實(shí)用。
相比較郵件客戶端,Python腳本的優(yōu)點(diǎn)在于可以智能、批量、高定制化地部署郵件服務(wù)。
需要的第三方庫(kù):
- Email - 用于管理電子郵件消息;
- Smtlib - 向SMTP服務(wù)器發(fā)送電子郵件,它定義了一個(gè) SMTP 客戶端會(huì)話對(duì)象,該對(duì)象可將郵件發(fā)送到互聯(lián)網(wǎng)上任何帶有 SMTP 或ESMTP 監(jiān)聽(tīng)程序的計(jì)算機(jī);
- Pandas - 用于數(shù)據(jù)分析清洗地工具;
import smtplib?
from email.message import EmailMessage
import pandas as pd
def send_email(remail, rsubject, rcontent):
? ? email = EmailMessage() ? ? ? ? ? ? ? ? ? ? ? ? ?## Creating a object for EmailMessage
? ? email['from'] = 'The Pythoneer Here' ? ? ? ? ? ?## Person who is sending
? ? email['to'] = remail ? ? ? ? ? ? ? ? ? ? ? ? ? ?## Whom we are sending
? ? email['subject'] = rsubject ? ? ? ? ? ? ? ? ? ? ## Subject of email
? ? email.set_content(rcontent) ? ? ? ? ? ? ? ? ? ? ## content of email
? ? with smtplib.SMTP(host='smtp.gmail.com',port=587)as smtp: ? ??
? ? ? ? smtp.ehlo() ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ## server object
? ? ? ? smtp.starttls() ? ? ? ? ? ? ? ? ? ? ? ? ? ? ## used to send data between server and client
? ? ? ? smtp.login("deltadelta371@gmail.com","delta@371") ## login id and password of gmail
? ? ? ? smtp.send_message(email) ? ? ? ? ? ? ? ? ? ?## Sending email
? ? ? ? print("email send to ",remail) ? ? ? ? ? ? ?## Printing success message
if __name__ == '__main__':
? ? df = pd.read_excel('list.xlsx')
? ? length = len(df)+1
? ? for index, item in df.iterrows():
? ? ? ? email = item[0]
? ? ? ? subject = item[1]
? ? ? ? content = item[2]
? ? ? ? send_email(email,subject,content)4、將 PDF 轉(zhuǎn)換為音頻文件
腳本可以將 pdf 轉(zhuǎn)換為音頻文件,原理也很簡(jiǎn)單,首先用 PyPDF 提取 pdf 中的文本,然后用 Pyttsx3 將文本轉(zhuǎn)語(yǔ)音。
import pyttsx3,PyPDF2?
pdfreader = PyPDF2.PdfFileReader(open('story.pdf','rb'))?
speaker = pyttsx3.init()?
for page_num in range(pdfreader.numPages): ? ?
? ? text = pdfreader.getPage(page_num).extractText() ?## extracting text from the PDF?
? ? cleaned_text = text.strip().replace('\n',' ') ?## Removes unnecessary spaces and break lines?
? ? print(cleaned_text) ? ? ? ? ? ? ? ?## Print the text from PDF?
? ? #speaker.say(cleaned_text) ? ? ? ?## Let The Speaker Speak The Text?
? ? speaker.save_to_file(cleaned_text,'story.mp3') ?## Saving Text In a audio file 'story.mp3'?
? ? speaker.runAndWait()?
speaker.stop()?5、從列表中播放隨機(jī)音樂(lè)
這個(gè)腳本會(huì)從歌曲文件夾中隨機(jī)選擇一首歌進(jìn)行播放,需要注意的是 os.startfile 僅支持 Windows 系統(tǒng)。
import random, os music_dir = 'G:\\new english songs' songs = os.listdir(music_dir) song = random.randint(0,len(songs)) print(songs[song]) ## Prints The Song Name os.startfile(os.path.join(music_dir, songs[0]))
6、智能天氣信息
國(guó)家氣象局網(wǎng)站提供獲取天氣預(yù)報(bào)的 API,直接返回 json 格式的天氣數(shù)據(jù)。所以只需要從 json 里取出對(duì)應(yīng)的字段就可以了。
下面是指定城市(縣、區(qū))天氣的網(wǎng)址,直接打開(kāi)網(wǎng)址,就會(huì)返回對(duì)應(yīng)城市的天氣數(shù)據(jù)。比如:
http://www.weather.com.cn/data/cityinfo/101021200.html 上海徐匯區(qū)對(duì)應(yīng)的天氣網(wǎng)址。
具體代碼如下:
import requests?
import json?
import logging as log?
def get_weather_wind(url):?
? ? r = requests.get(url)?
? ? if r.status_code != 200:?
? ? ? ? log.error("Can't get weather data!")?
? ? info = json.loads(r.content.decode())?
? ? # get wind data?
? ? data = info['weatherinfo']?
? ? WD = data['WD']?
? ? WS = data['WS']?
? ? return "{}({})".format(WD, WS)?
def get_weather_city(url):?
? ? # open url and get return data?
? ? r = requests.get(url)?
? ? if r.status_code != 200:?
? ? ? ? log.error("Can't get weather data!")?
? ? # convert string to json?
? ? info = json.loads(r.content.decode())?
? ? # get useful data?
? ? data = info['weatherinfo']?
? ? city = data['city']?
? ? temp1 = data['temp1']?
? ? temp2 = data['temp2']?
? ? weather = data['weather']?
? ? return "{} {} {}~{}".format(city, weather, temp1, temp2)?
if __name__ == '__main__':?
? ? msg = """**天氣提醒**: ??
{} {} ??
{} {} ??
來(lái)源: 國(guó)家氣象局?
""".format(?
? ? get_weather_city('http://www.weather.com.cn/data/cityinfo/101021200.html'),?
? ? get_weather_wind('http://www.weather.com.cn/data/sk/101021200.html'),?
? ? get_weather_city('http://www.weather.com.cn/data/cityinfo/101020900.html'),?
? ? get_weather_wind('http://www.weather.com.cn/data/sk/101020900.html')?
)?
? ? print(msg)?運(yùn)行結(jié)果如下所示:

7、長(zhǎng)網(wǎng)址變短網(wǎng)址
有時(shí),那些大URL變得非常惱火,很難閱讀和共享,此腳可以將長(zhǎng)網(wǎng)址變?yōu)槎叹W(wǎng)址。
import contextlib?
from urllib.parse import urlencode?
from urllib.request import urlopen?
import sys?
def make_tiny(url):?
?request_url = ('http://tinyurl.com/api-create.php?' + ?
?urlencode({'url':url}))?
?with contextlib.closing(urlopen(request_url)) as response:?
? return response.read().decode('utf-8')?
def main():?
?for tinyurl in map(make_tiny, sys.argv[1:]):?
? print(tinyurl)?
if __name__ == '__main__':?
?main()?這個(gè)腳本非常實(shí)用,比如說(shuō)有內(nèi)容平臺(tái)是屏蔽公眾號(hào)文章的,那么就可以把公眾號(hào)文章的鏈接變?yōu)槎替溄?,然后插入其中,就可以?shí)現(xiàn)繞過(guò)。
8、清理下載文件夾
世界上最混亂的事情之一是開(kāi)發(fā)人員的下載文件夾,里面存放了很多雜亂無(wú)章的文件,此腳本將根據(jù)大小限制來(lái)清理您的下載文件夾,有限清理比較舊的文件。
import os?
import threading?
import time?
def get_file_list(file_path):?
#文件按最后修改時(shí)間排序?
? ? dir_list = os.listdir(file_path)?
? ? if not dir_list:?
? ? ? ? return?
? ? else:?
? ? ? ? dir_list = sorted(dir_list, key=lambda x: os.path.getmtime(os.path.join(file_path, x)))?
? ? return dir_list?
def get_size(file_path):?
? ? """[summary]?
? ? Args:?
? ? ? ? file_path ([type]): [目錄](méi)?
? ? Returns:?
? ? ? ? [type]: 返回目錄大小,MB?
? ? """?
? ? totalsize=0?
? ? for filename in os.listdir(file_path):?
? ? ? ? totalsize=totalsize+os.path.getsize(os.path.join(file_path, filename))?
? ? #print(totalsize / 1024 / 1024)?
? ? return totalsize / 1024 / 1024?
def detect_file_size(file_path, size_Max, size_Del):?
? ? """[summary]?
? ? Args:?
? ? ? ? file_path ([type]): [文件目錄](méi)?
? ? ? ? size_Max ([type]): [文件夾最大大小]?
? ? ? ? size_Del ([type]): [超過(guò)size_Max時(shí)要?jiǎng)h除的大小]?
? ? """?
? ? print(get_size(file_path))?
? ? if get_size(file_path) > size_Max:?
? ? ? ? fileList = get_file_list(file_path)?
? ? ? ? for i in range(len(fileList)):?
? ? ? ? ? ? if get_size(file_path) > (size_Max - size_Del):?
? ? ? ? ? ? ? ? print ("del :%d %s" % (i + 1, fileList[i]))?
? ? ? ? ? ? ? ? #os.remove(file_path + fileList[i])?到此這篇關(guān)于八個(gè)超級(jí)好用的Python自動(dòng)化腳本(小結(jié))的文章就介紹到這了,更多相關(guān)Python自動(dòng)化腳本內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python爬蟲(chóng)豆瓣網(wǎng)的模擬登錄實(shí)現(xiàn)
這篇文章主要介紹了python爬蟲(chóng)豆瓣網(wǎng)的模擬登錄實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08
Python純代碼通過(guò)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)線性回歸的擬合方式
這篇文章主要介紹了Python純代碼通過(guò)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)線性回歸的擬合方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05
在pycharm中無(wú)法import所安裝的庫(kù)解決方案
這篇文章主要介紹了在pycharm中無(wú)法import所安裝的庫(kù)解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05
使用python3調(diào)用wxpy模塊監(jiān)控linux日志并定時(shí)發(fā)送消息給群組或好友
這篇文章主要介紹了使用python3調(diào)用wxpy模塊,監(jiān)控linux日志并定時(shí)發(fā)送消息給群組或好友,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-06-06
對(duì)Python3中的print函數(shù)以及與python2的對(duì)比分析
下面小編就為大家分享一篇對(duì)Python3中的print函數(shù)以及與python2的對(duì)比分析,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-05-05

