python實現(xiàn)去除下載電影和電視劇文件名中的多余字符的方法
本文實例講述了python實現(xiàn)去除下載電影和電視劇文件名中的多余字符的方法,是一個非常實用的技巧,分享給大家供大家參考。具體如下:
有時候我們討厭下載電影和電視劇文件名中的多余字符(如網(wǎng)址和廣告字樣),搞得文件名好長!不便于查看,這時候就可以使用下面的Python代碼,自行修改即可.
具體實現(xiàn)代碼如下:
#!\usr\bin\env python
# -*- coding: utf-8 -*-
# Author: 吳徐平
# FileName: RefineFileName.py
# Function:
# 下載的電影電視文件名太長,
# 常常含有多余的字符,如'中英雙字幕',
# 可以使用本Python代碼去掉
# Using python 2.7.X,win xp sp3
import sys
import os
import re
# 文件夾目錄列表
FileDirectoryList=[\
u"E:\\電視電影\\都市俠盜.Leverage",\
u"E:\\電視電影\\犯罪心理.Criminal.Minds",\
u"E:\\電視電影\\海軍罪案調(diào)查處.NCIS",\
u"E:\\電視電影\\警察世家.Blue.Bloods"\
]
#文件名開頭處是否需要添加的字符串
#不需要添加字符時,留空(或空白)字符來表示
AddStringList=[\
u'Leverage',\
u'Criminal.Minds',\
u'NCIS.',\
u'Blue.Bloods.'
]
# 文件名中必須去掉的字符
MustReplaceStringList=[\
u'都市俠盜',\
u'犯罪心理',\
u'海軍罪案調(diào)查處',\
u'警察世家',\
u'人人影視',\
u'SFiles',\
u'YYeTs',\
]
# 去掉所有不必要的字符
NewString=u'';
# 自定義重命名文件的函數(shù)
def RenameFileName(OldFileName,NewFileName):
oldpath,oldfn = os.path.split(OldFileName)
newpath,newfn = os.path.split(NewFileName)
print(oldpath.encode('ascii','ignore'))
os.rename(OldFileName, NewFileName)
#print (oldfn.encode('ascii','ignore')+' --> '+newfn.encode('ascii','ignore'))
#正則表達式替換,最多一次,忽略大小寫
def StringRegexReplace(pattern,repl,string):
return re.sub(pattern, repl, string, count=1, flags=re.I)
# 循環(huán)#硬盤的電影電視劇所有目錄下的文件
for FileDirectory in FileDirectoryList:
FileNamesList=os.listdir(FileDirectory)
# 循環(huán)重新命名文件
for filenamei in FileNamesList:
# 首先去掉文件名中的空格字符
RefinedFileName=filenamei.replace(u' ',NewString)
# 循環(huán)必須去掉的文件名列表
for MustReplaceString in MustReplaceStringList:
RefinedFileName=RefinedFileName.replace(MustReplaceString,NewString)
#去掉錄制信息
RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*rip(?=[\.\-_])','',RefinedFileName)
RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])xvi[^.]*(?=[\.\-_])','',RefinedFileName)
#去掉分辨率
RefinedFileName=StringRegexReplace('\d{1,4}X\d{1,4}','',RefinedFileName)
#去掉[*]里面的所有內(nèi)容
RefinedFileName=StringRegexReplace(u'\[.*\]','',RefinedFileName)
#去掉網(wǎng)址
RefinedFileName=StringRegexReplace(u'www\..*\.((com)|(net)|(cn)|(org))','',RefinedFileName)
#去掉字幕(組)的字樣
RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*字幕組?','',RefinedFileName)
#去掉出品和作品字樣
RefinedFileName=StringRegexReplace(u'(?<=[\.\-_])[^.]*[出作]品','',RefinedFileName)
#去掉開頭的點.下劃線_連接符-等
RefinedFileName=StringRegexReplace(u'^[._\-]','',RefinedFileName)
# 經(jīng)常出現(xiàn)兩個點以上,直接替換成一個點
RefinedFileName=RefinedFileName.replace(u'...',u'.')
RefinedFileName=RefinedFileName.replace(u'..',u'.')
# 可以重新命名了
OldFileName=os.path.join(FileDirectory,filenamei)
NewFileName=os.path.join(FileDirectory,RefinedFileName)
RenameFileName(OldFileName,NewFileName)
####下面的代碼在文件頭添加字符串
#判斷是否已經(jīng)添加了字符串
def HasAddString(AddString0,FileNameString0):
if (len(AddString0.strip())<1):#AddString0為空字符不需要再添加任何字符了
print('Empty AddString,No need to add to : '+ FileNameString0.encode('ascii','ignore'))
return True
else:
AddString=AddString0.strip().lower()
FileNameString=FileNameString0.strip().lower()
if(len(FileNameString)<=len(AddString)):
return False
else:
if(FileNameString[0:(len(AddString)-1)]==AddString[0:(len(AddString)-1)]):
return True
else:
return False
DirCounter=0;
# 循環(huán)#硬盤的電影電視劇所有目錄下的文件
for FileDirectory in FileDirectoryList:
FileNamesList=os.listdir(FileDirectory)
AddString =AddStringList[DirCounter]
DirCounter=DirCounter+1
# 循環(huán)重新命名文件
for filenamei in FileNamesList:
#已經(jīng)加過的文件名不再添加字符了
if HasAddString(AddString,filenamei):
print(filenamei.encode('ascii','ignore')+' : ALready Added Header String!')
else:
# 首先連接字符串
RefinedFileName=AddString+filenamei
# 可以重新命名了
OldFileName=os.path.join(FileDirectory,filenamei)
NewFileName=os.path.join(FileDirectory,RefinedFileName)
RenameFileName(OldFileName,NewFileName)
print(filenamei.encode('ascii','ignore')+' : Add Header String, OK!')
對文件名的修改有特殊要求的,可以將StringRegexReplace函數(shù)用上.
運行本文實例后可以看到下面的電視劇文件名看起來就舒服多了:

希望本文所述實例對大家的Python程序設(shè)計能有所幫助。
- 使用Python多線程爬蟲爬取電影天堂資源
- 基于python實現(xiàn)的抓取騰訊視頻所有電影的爬蟲
- 編寫Python爬蟲抓取豆瓣電影TOP100及用戶頭像的方法
- Python抓取電影天堂電影信息的代碼
- python實現(xiàn)根據(jù)用戶輸入從電影網(wǎng)站獲取影片信息的方法
- python正則表達式爬取貓眼電影top100
- 使用python實現(xiàn)抓取騰訊視頻所有電影的爬蟲
- python使用requests模塊實現(xiàn)爬取電影天堂最新電影信息
- Python爬取APP下載鏈接的實現(xiàn)方法
- Python3.6實現(xiàn)根據(jù)電影名稱(支持電視劇名稱),獲取下載鏈接的方法
相關(guān)文章
Python中一些不為人知的基礎(chǔ)技巧總結(jié)
這篇文章主要給大家總結(jié)介紹了Python中一些不為人知的基礎(chǔ)技巧,文中通過示例代碼介紹的非常詳細(xì),對大家學(xué)習(xí)或者使用python具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2018-05-05
python Pandas中數(shù)據(jù)的合并與分組聚合
大家好,本篇文章主要講的是python Pandas中數(shù)據(jù)的合并與分組聚合,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下2022-01-01
Python語法糖for?else循環(huán)語句里的break使用詳解
這篇文章主要介紹了Python語法糖之for?else循環(huán)語句里的break使用詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-05-05
解決pandas read_csv 讀取中文列標(biāo)題文件報錯的問題
今天小編就為大家分享一篇解決pandas read_csv 讀取中文列標(biāo)題文件報錯的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-06-06
OpenCV機器學(xué)習(xí)MeanShift算法筆記分享
這篇文章主要介紹了OpenCV機器學(xué)習(xí)MeanShift算法筆記分享,有需要的朋友可以借鑒參考下,希望可以對各位讀者的OpenCV算法學(xué)習(xí)能夠有所幫助2021-09-09
python中Tkinter詳細(xì)基礎(chǔ)教學(xué)實例代碼
這篇文章主要給大家介紹了關(guān)于python中Tkinter詳細(xì)基礎(chǔ)教學(xué)的相關(guān)資料,文中介紹了如Label、Button、Entry、Text、Frame、Menu、Canvas、Messagebox等的基本屬性和用法,并介紹了布局管理器pack、grid和place的使用方法,需要的朋友可以參考下2024-12-12
Python的math模塊中的常用數(shù)學(xué)函數(shù)整理
這篇文章主要介紹了Python的math模塊中的常用數(shù)學(xué)函數(shù)整理,同時對運算符的運算優(yōu)先級作了一個羅列,需要的朋友可以參考下2016-02-02

