C#實(shí)現(xiàn)的字符串相似度對比類
更新時間:2015年07月04日 09:48:59 投稿:junjie
這篇文章主要介紹了C#實(shí)現(xiàn)的字符串相似度對比類,本文直接給出類實(shí)現(xiàn)代碼,代碼中包含詳細(xì)注釋,需要的朋友可以參考下
本類適用于比較2個字符的相似度,代碼如下:
using System;
using System.Collections.Generic;
using System.Text;
public class StringCompute
{
#region 私有變量
/// <summary>
/// 字符串1
/// </summary>
private char[] _ArrChar1;
/// <summary>
/// 字符串2
/// </summary>
private char[] _ArrChar2;
/// <summary>
/// 統(tǒng)計(jì)結(jié)果
/// </summary>
private Result _Result;
/// <summary>
/// 開始時間
/// </summary>
private DateTime _BeginTime;
/// <summary>
/// 結(jié)束時間
/// </summary>
private DateTime _EndTime;
/// <summary>
/// 計(jì)算次數(shù)
/// </summary>
private int _ComputeTimes;
/// <summary>
/// 算法矩陣
/// </summary>
private int[,] _Matrix;
/// <summary>
/// 矩陣列數(shù)
/// </summary>
private int _Column;
/// <summary>
/// 矩陣行數(shù)
/// </summary>
private int _Row;
#endregion
#region 屬性
public Result ComputeResult
{
get { return _Result; }
}
#endregion
#region 構(gòu)造函數(shù)
public StringCompute(string str1, string str2)
{
this.StringComputeInit(str1, str2);
}
public StringCompute()
{
}
#endregion
#region 算法實(shí)現(xiàn)
/// <summary>
/// 初始化算法基本信息
/// </summary>
/// <param name="str1">字符串1</param>
/// <param name="str2">字符串2</param>
private void StringComputeInit(string str1, string str2)
{
_ArrChar1 = str1.ToCharArray();
_ArrChar2 = str2.ToCharArray();
_Result = new Result();
_ComputeTimes = 0;
_Row = _ArrChar1.Length + 1;
_Column = _ArrChar2.Length + 1;
_Matrix = new int[_Row, _Column];
}
/// <summary>
/// 計(jì)算相似度
/// </summary>
public void Compute()
{
//開始時間
_BeginTime = DateTime.Now;
//初始化矩陣的第一行和第一列
this.InitMatrix();
int intCost = 0;
for (int i = 1; i < _Row; i++)
{
for (int j = 1; j < _Column; j++)
{
if (_ArrChar1[i - 1] == _ArrChar2[j - 1])
{
intCost = 0;
}
else
{
intCost = 1;
}
//關(guān)鍵步驟,計(jì)算當(dāng)前位置值為左邊+1、上面+1、左上角+intCost中的最小值
//循環(huán)遍歷到最后_Matrix[_Row - 1, _Column - 1]即為兩個字符串的距離
_Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);
_ComputeTimes++;
}
}
//結(jié)束時間
_EndTime = DateTime.Now;
//相似率 移動次數(shù)小于最長的字符串長度的20%算同一題
int intLength = _Row > _Column ? _Row : _Column;
_Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);
_Result.UseTime = (_EndTime - _BeginTime).ToString();
_Result.ComputeTimes = _ComputeTimes.ToString();
_Result.Difference = _Matrix[_Row - 1, _Column - 1];
}
/// <summary>
/// 計(jì)算相似度(不記錄比較時間)
/// </summary>
public void SpeedyCompute()
{
//開始時間
//_BeginTime = DateTime.Now;
//初始化矩陣的第一行和第一列
this.InitMatrix();
int intCost = 0;
for (int i = 1; i < _Row; i++)
{
for (int j = 1; j < _Column; j++)
{
if (_ArrChar1[i - 1] == _ArrChar2[j - 1])
{
intCost = 0;
}
else
{
intCost = 1;
}
//關(guān)鍵步驟,計(jì)算當(dāng)前位置值為左邊+1、上面+1、左上角+intCost中的最小值
//循環(huán)遍歷到最后_Matrix[_Row - 1, _Column - 1]即為兩個字符串的距離
_Matrix[i, j] = this.Minimum(_Matrix[i - 1, j] + 1, _Matrix[i, j - 1] + 1, _Matrix[i - 1, j - 1] + intCost);
_ComputeTimes++;
}
}
//結(jié)束時間
//_EndTime = DateTime.Now;
//相似率 移動次數(shù)小于最長的字符串長度的20%算同一題
int intLength = _Row > _Column ? _Row : _Column;
_Result.Rate = (1 - (decimal)_Matrix[_Row - 1, _Column - 1] / intLength);
// _Result.UseTime = (_EndTime - _BeginTime).ToString();
_Result.ComputeTimes = _ComputeTimes.ToString();
_Result.Difference = _Matrix[_Row - 1, _Column - 1];
}
/// <summary>
/// 計(jì)算相似度
/// </summary>
/// <param name="str1">字符串1</param>
/// <param name="str2">字符串2</param>
public void Compute(string str1, string str2)
{
this.StringComputeInit(str1, str2);
this.Compute();
}
/// <summary>
/// 計(jì)算相似度
/// </summary>
/// <param name="str1">字符串1</param>
/// <param name="str2">字符串2</param>
public void SpeedyCompute(string str1, string str2)
{
this.StringComputeInit(str1, str2);
this.SpeedyCompute();
}
/// <summary>
/// 初始化矩陣的第一行和第一列
/// </summary>
private void InitMatrix()
{
for (int i = 0; i < _Column; i++)
{
_Matrix[0, i] = i;
}
for (int i = 0; i < _Row; i++)
{
_Matrix[i, 0] = i;
}
}
/// <summary>
/// 取三個數(shù)中的最小值
/// </summary>
/// <param name="First"></param>
/// <param name="Second"></param>
/// <param name="Third"></param>
/// <returns></returns>
private int Minimum(int First, int Second, int Third)
{
int intMin = First;
if (Second < intMin)
{
intMin = Second;
}
if (Third < intMin)
{
intMin = Third;
}
return intMin;
}
#endregion
}
/// <summary>
/// 計(jì)算結(jié)果
/// </summary>
public struct Result
{
/// <summary>
/// 相似度
/// </summary>
public decimal Rate;
/// <summary>
/// 對比次數(shù)
/// </summary>
public string ComputeTimes;
/// <summary>
/// 使用時間
/// </summary>
public string UseTime;
/// <summary>
/// 差異
/// </summary>
public int Difference;
}
調(diào)用方法:
// 方式一
StringCompute stringcompute1 = new StringCompute();
stringcompute1.SpeedyCompute("對比字符一", "對比字符二"); // 計(jì)算相似度, 不記錄比較時間
decimal rate = stringcompute1.ComputeResult.Rate; // 相似度百分之幾,完全匹配相似度為1
// 方式二
StringCompute stringcompute2 = new StringCompute();
stringcompute2.Compute(); // 計(jì)算相似度, 記錄比較時間
string usetime = stringcompute2.ComputeResult.UseTime; // 對比使用時間
您可能感興趣的文章:
- C#、.Net中把字符串(String)格式轉(zhuǎn)換為DateTime類型的三種方法
- C#中使用強(qiáng)制類型實(shí)現(xiàn)字符串和ASCII碼之間的轉(zhuǎn)換
- C#實(shí)現(xiàn)實(shí)體類與字符串互相轉(zhuǎn)換的方法
- C#生成不重復(fù)隨機(jī)字符串類
- C#實(shí)現(xiàn)將類的內(nèi)容寫成JSON格式字符串的方法
- c#字符串值類型與引用類型比較示例
- C#字符串的常用操作工具類代碼分享
- 在C#及.NET框架中使用StringBuilder類操作字符串的技巧
- C#實(shí)現(xiàn)簡易的加密、解密字符串工具類實(shí)例
- 非常實(shí)用的C#字符串操作處理類StringHelper.cs
相關(guān)文章
基于C# wpf 實(shí)現(xiàn)Grid內(nèi)控件拖動詳情
這篇文章主要介紹了基于C# wpf 實(shí)現(xiàn)Grid內(nèi)控件拖動,有一些業(yè)務(wù)場景中我們需要拖動控件,在Grid中就可以實(shí)現(xiàn)控件拖動,通過設(shè)置Margin屬性即可,下面文章我們來看看具體的實(shí)現(xiàn)內(nèi)容2021-11-11
C# Winform按鈕中圖片實(shí)現(xiàn)左圖右字的效果實(shí)例
這篇文章主要給大家介紹了關(guān)于C# Winform按鈕中圖片實(shí)現(xiàn)左圖右字效果的相關(guān)資料,文中通過圖文介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11
C#自定義實(shí)現(xiàn)多程序共享內(nèi)存空間
這篇文章主要為大家詳細(xì)介紹了C#如何自定義實(shí)現(xiàn)多程序共享內(nèi)存空間,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2024-10-10
其實(shí)/FileShare就是控制文件流的“訪問權(quán)限”,當(dāng)然,這僅僅是入門的文件操作,自己做了筆記,也希望能給大家?guī)韼椭?/div> 2014-01-01
C#調(diào)用7z實(shí)現(xiàn)文件的壓縮與解壓
這篇文章主要介紹了C#調(diào)用7z實(shí)現(xiàn)文件的壓縮與解壓,幫助大家更好的理解和使用c#,感興趣的朋友可以了解下2020-12-12最新評論

