Go語言實現統(tǒng)計字符串中每個字符出現的次數
一、 案例目標
本案例將實現一個程序,接收用戶輸入的一段文字,并統(tǒng)計其中每個字符(包括中文、英文、數字等)出現的次數,并按字符輸出。
例如輸入:
Hello, 世界!
輸出:
H: 1
e: 1
l: 2
o: 1
,: 1
: 1
世: 1
界: 1
!: 1
二、 應用場景舉例
- 文本分析、關鍵詞提取
- 字符頻率統(tǒng)計(用于密碼分析、數據挖掘)
- 字符畫處理(字符權重)
- AI、自然語言處理基礎任務之一
三、 涉及知識點講解
| 知識點 | 說明 |
|---|---|
| map[rune]int | Go 中用于統(tǒng)計頻率的典型用法 |
| rune | 支持 Unicode 字符(中文、表情、特殊符號) |
| for _, r := range str | 正確遍歷字符串每個字符(而不是每個字節(jié)) |
四、實現需求
- 用戶輸入任意一段文字;
- 程序逐個字符統(tǒng)計出現次數;
- 忽略字節(jié)編碼問題,支持中文;
- 輸出格式整齊,便于查看;
- 可拓展成圖表/詞云工具基礎。
五、 完整代碼實現
package main
import (
"bufio"
"fmt"
"os"
"sort"
)
func main() {
reader := bufio.NewReader(os.Stdin)
fmt.Print("請輸入一段文字:")
input, _ := reader.ReadString('\n')
counts := countCharacters(input)
// 排序輸出
var keys []rune
for k := range counts {
keys = append(keys, k)
}
sort.Slice(keys, func(i, j int) bool {
return keys[i] < keys[j]
})
fmt.Println("\n字符統(tǒng)計結果:")
for _, r := range keys {
fmt.Printf("%q: %d\n", r, counts[r])
}
}
// 統(tǒng)計字符出現次數
func countCharacters(s string) map[rune]int {
result := make(map[rune]int)
for _, r := range []rune(s) {
result[r]++
}
return result
}
六、運行示例
示例1:
請輸入一段文字:hello, 世界
字符統(tǒng)計結果:
'\t': 1
',': 1
'e': 1
'h': 1
'l': 2
'o': 1
'世': 1
'界': 1
'\n': 1
'\n' 和 '\t' 說明:默認輸入帶有換行符,可根據需要清洗。
七、 核心代碼解析
| 代碼段 | 說明 |
|---|---|
| map[rune]int | 創(chuàng)建一個以字符為鍵、出現次數為值的映射 |
| []rune(s) | 將字符串轉為字符切片,避免中文字符拆分錯誤 |
| sort.Slice | 將輸出結果按字符順序排序 |
八、 拓展練習建議
- 排除空格或標點,只統(tǒng)計字母與數字;
- 將結果寫入文件保存;
- 改為支持詞語統(tǒng)計(用
strings.Fields()分詞); - 輸出詞頻圖或柱狀圖(結合
github.com/olekukonko/tablewriter或 ASCII 圖表庫);
九、 常見錯誤提示
- 遍歷字符串用
[]byte:會導致中文字符被拆成多個 byte; - 統(tǒng)計字符時忘記使用
rune類型; - 輸出結果不排序,閱讀困難。
小結
通過這個案例,你學會了:
- 如何遍歷字符串中每一個字符(支持中文)
- 如何使用
map來進行頻率統(tǒng)計 - 如何對統(tǒng)計結果進行排序并美觀輸出
這是實際項目中非常有價值的一種“文本特征提取”技術,是通往 NLP 和算法世界的一扇小門。
到此這篇關于Go語言實現統(tǒng)計字符串中每個字符出現的次數的文章就介紹到這了,更多相關Go統(tǒng)計字符內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
golang實現微信小程序商城后臺系統(tǒng)(moshopserver)
這篇文章主要介紹了golang實現微信小程序商城后臺系統(tǒng)(moshopserver),本文通過截圖實例代碼的形式給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2020-02-02

