使用Python 統(tǒng)計高頻字?jǐn)?shù)的方法

更新時間：2019年01月31日 14:57:31 作者：Silent_Summer

今天小編就為大家分享一篇使用Python 統(tǒng)計高頻字?jǐn)?shù)的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

問題

(來自Udacity機器學(xué)習(xí)工程師納米學(xué)位預(yù)覽課程)

用 Python 實現(xiàn)函數(shù) count_words()，該函數(shù)輸入字符串 s 和數(shù)字 n，返回 s 中 n 個出現(xiàn)頻率最高的單詞。返回值是一個元組列表，包含出現(xiàn)次數(shù)最高的 n 個單詞及其次數(shù),即 [(<單詞1>, <次數(shù)1>), (<單詞2>, <次數(shù)2>), ... ]，按出現(xiàn)次數(shù)降序排列。

可以假設(shè)所有輸入都是小寫形式，并且不含標(biāo)點符號或其他字符（只包含字母和單個空格）。如果出現(xiàn)次數(shù)相同，則按字母順序排列。

例如：

print count_words("betty bought a bit of butter but the butter was bitter",3)

輸出

[('butter', 2), ('a', 1), ('betty', 1)]

解法

"""Count words."""

def count_words(s, n):
  """Return the n most frequently occuring words in s."""
  w = {}
  sp = s.split()
  # TODO: Count the number of occurences of each word in s
  for i in sp:
    if i not in w:
      w[i] = 1
    else:
      w[i] += 1

  # TODO: Sort the occurences in descending order (alphabetically in case of ties)
  top = sorted(w.items(), key=lambda item:(-item[1], item[0]))
  top_n = top[:n]
  # TODO: Return the top n most frequent words.
  return top_n


def test_run():
  """Test count_words() with some inputs."""
  print count_words("cat bat mat cat bat cat", 3)
  print count_words("betty bought a bit of butter but the butter was bitter", 3)


if __name__ == '__main__':
  test_run()

小結(jié)

主要兩個小技巧：

用split()將輸入字符串按空格分開；

用sorted()函數(shù)對字典先按值，再按鍵進行排序，尤其是item:(-item[1], item[0])) 代表先對item的第二個元素降序排列（item 之前用了-），然后對第一個元素升序排列。多個元素的元組亦然。

以上這篇使用Python 統(tǒng)計高頻字?jǐn)?shù)的方法就是小編分享給大家的全部內(nèi)容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

這篇文章主要為大家介紹了Python類和對象，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2021-12-12

Python中的 any() 函數(shù)和 all() 函數(shù)

這篇文章主要介紹了Python中的 any() 函數(shù)和 all() 函數(shù)，文章基于Python的相關(guān)資料展開對 any 和 all() 函數(shù)的語法詳細(xì)內(nèi)容，具有一定的參考價值，需要的小伙伴可以參考一下

2022-04-04

python中os.path.join()函數(shù)實例用法

在本篇文章里小編給大家整理的是一篇關(guān)于python中os.path.join()函數(shù)實例用法，有興趣的朋友們可以跟著學(xué)習(xí)參考下。

2021-05-05

Python增量循環(huán)刪除MySQL表數(shù)據(jù)的方法

這篇文章主要介紹了Python增量循環(huán)刪除MySQL表數(shù)據(jù)的相關(guān)資料,本文介紹的非常詳細(xì)，具有參考借鑒價值，需要的朋友可以參考下

2016-09-09

python基礎(chǔ)之局部變量和全局變量

這篇文章主要介紹了python局部變量和全局變量,實例分析了Python中返回一個返回值與多個返回值的方法,需要的朋友可以參考下

2021-10-10

Gradio機器學(xué)習(xí)模型快速部署工具應(yīng)用分享

這篇文章主要為大家介紹了Gradio機器學(xué)習(xí)模型快速部署工具應(yīng)用分享原文翻譯，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪

2023-04-04

Python基本知識之datetime模塊詳解

這篇文章主要給大家介紹了關(guān)于Python基本知識之datetime模塊的相關(guān)資料,Python內(nèi)置的時間模塊datetime包含下面的模塊包含六個類和兩個常數(shù),提供了用于處理日期和時間的類和對應(yīng)的方法,一般用于處理年、月、日、時、分、秒的統(tǒng)計和計算等需求,需要的朋友可以參考下

2023-08-08