主页 > 怎么在华为下imtoken > 一种区块链数字货币的实体身份类型估计方法及系统

一种区块链数字货币的实体身份类型估计方法及系统

怎么在华为下imtoken 2023-01-18 20:17:16

一种区块链数字货币的实体身份类型推测方法及系统

1.本发明涉及区块链技术领域,涉及一种估计区块链数字货币的实体身份类型的方法及系统,尤其涉及一种适用于估计实体身份类型的方法及系统。以交易为中心的区块链数字货币。

背景技术:

2.日本学者在 2008 年的一篇论文中首次提出“比特币”的概念,并于 2015 年在 The Economist 上发表了题目。对于文章“信任机器”(trust machine),底层技术比特币的区块链逐渐流行起来,许多专家学者都致力于区块链技术的研究。区块链技术的不断发展,也催生了越来越多以比特币为底层技术的数字货币。区块链数字货币具有不同于传统数字货币的去中心化、不变性、匿名性等特点。这些特性保证了区块链网络中节点的相对自由和安全,同时也使得整个区块链数字货币网络充斥着各种非法交易,给相关部门的监管带来巨大挑战。因此,在保证用户真实信息不泄露的情况下,利用区块链本身的交易信息和交易特征来推测区块链数字货币的实体身份类型。合法性很重要。

3.目前区块链数字货币网络实体类型估计研究主要包括:基于交易属性的实体身份估计方法、基于交易行为的实体身份估计方法、基于链下信息的实体身份推断方法. (1)基于交易属性的实体身份估计方法主要采用区块链数字货币启发式聚类方法,将属于同一实体的交易地址聚类为一类,识别为同一实体;(2)@ >基于交易行为的实体身份估计方法主要采用机器学习的分类聚类方法,以区块链数字货币交易信息为特征输入,以虚拟地址账户识别分类为输出,实现虚拟地址账户识别。目的;(3)一种基于链下信息的实体身份估计方法,通过将区块链数字货币中的实体等链下信息与用户在比特币论坛等网站上发布的信息相结合,用户 ip 地址和电子邮件地址 关联的实体识别。

4.但是以上三个研究方案都存在一些缺陷; (1)基于交易属性的实体身份推测方案存在低估错误和高估错误问题;(2)@>基于交易行为的实体身份推测方案不足以进行交易的特征提取和使用历史,而忽略了交易模式的特点。(3)基于链下信息的实体身份投机方案只能分析暴露IP地址等信息或出现在比特币论坛的实体身份。

技术实施要素:

5.针对上述问题,本发明提供了一种估计区块链数字货币的实体身份类型的方法和系统,利用区块链数字货币的原始交易数据,构建特征融合数据集通过特征筛选和降维区块链的特征,并通过机器学习对其进行分类。该方法推测区块链虚拟地址账户的身份类型,利用区块链启发式聚类方法设计基于投票的纠错机制来推测区块链数字货币的实体身份类型,从而提高对区块链数字货币的理解。区块链数字货币。实体身份的推理效果。

6.为了实现上述目的,本发明提供了一种推断区块链数字货币的实体身份类型的方法,包括:

7.根据区块链数字货币原始交易数据集进行特征提取和降维,得到融合特征数据集,得到融合特征数据集;

8.融合特征数据集分为训练样本和验证样本,根据训练样本训练虚拟地址账户身份类型识别模型得到分类器;

9. 验证样本进行虚拟地址账户身份类型识别,得到虚拟地址账户身份类型表;每个实体的所有虚拟地址账户和对应的身份类型;身份类型。

12.作为本发明的进一步改进,根据区块链数字货币的原始交易数据集,进行特征提取和降维,得到融合特征数据集;包括:

13.根据区块链数字货币的原始交易数据对初始特征数据集进行特征提取,得到初始特征数据集;

14.对初始特征数据集进行特征筛选和降维处理,得到融合特征数据集。

15.作为本发明的进一步改进,

16.将区块链数字货币的原始交易数据集解析为地址数据集和交易数据集;

17.将地址数据集和交易数据集1中的数据映射到n,并输入feature-tools特征生成工具,聚合和变换操作自动计算初始特征数据集。

18.作为本发明的进一步改进,基于信息增益计算初始特征数据集中各特征的特征贡献值,选择特征贡献值高于预设贡献度阈值特征,得到新的特征数据集;

19.对新的特征数据集进行PCA降维处理,得到融合特征数据集。

区块链的特征

20.作为本发明的进一步改进,根据训练样本训练虚拟地址账户身份类型识别模型,得到分类器,包括:

21.训练样本分为训练数据和测试数据;

22.虚拟地址账户身份类型识别模型由训练数据训练,训练数据由测试数据训练。对得到的虚拟地址账户身份类型识别模型进行效果测试;模型作为分类器。

24.作为本发明的进一步改进,

25.分类器对验证样本到n的每一组数据依次判断是否属于类型1;

26.过程中,如果判断为是,则该组数据属于对应类型;

27.如果判断为否,则该组数据为其他类型。

28.作为本发明的进一步改进,采用启发式聚类方法对虚拟地址账户身份类型表中的虚拟地址账户进行聚类,得到多个实体。

29.作为本发明的进一步改进,根据实体的每种身份类型的虚拟地址账户数量的比例确定实体的身份类型;包括:

30.分别计算实体各身份类型的虚拟地址账户占比,得到占比最大的身份类型及对应比例;

3 1.判断该比例是否大于0.5,如果判断为是,则推断该实体的身份类型为占比最大的身份类型

,将实体的所有虚拟地址账户确定为占比最大的身份类型。

32.作为本发明的进一步改进,如果判断为否,则认为无法推断出实体的虚拟地址账户的身份类型。

33.本发明还提供了一种区块链数字货币实体身份类型估计系统,包括:数据准备模块、模型训练模块、虚拟地址账户身份类型初步估计模块,启发式误差修正推测模块;

34.数据准备模块用于:

35.根据区块链数字货币对原始交易数据集进行特征提取和降维得到融合特征数据集,得到融合特征数据集; p>37.融合特征数据集分为训练样本和验证样本,根据训练样本训练虚拟地址账户身份类型识别模型得到分类器;

38.虚拟地址账户身份类型初步猜测模块用于:

39.通过分类器识别验证样本上的虚拟地址账户身份类型,得到虚拟地址账户身份类型表;

40.启发式纠错推测模块用于:

区块链的特征

41.根据虚拟地址对账户身份类型表进行聚类,得到多个实体,统计所有虚拟地址账户和每个实体对应的身份类型;

42.根据每个实体类型的身份类型的虚拟地址账户数量的比例来确定实体的身份类型。

43.与现有技术相比,本发明的有益效果是:

44.本发明利用了区块链数字货币的原始原理。有交易数据,自动生成特征,通过特征筛选、数据降维等构建样本特征数据集,利用机器学习分类方法推测区块链虚拟地址账户的身份类型,进而利用区块链启发式聚类。方法设计基于投票的纠错机制,推测区块链数字货币的实体身份类型区块链的特征,从而完成一种适用于以交易为中心的区块链数字货币的实体身份类型推断方法,提高实体身份类型推断的效果.

45.本发明基于原始交易数据的自动特征提取方案,可以提高信息数据的利用率,防止关键信息丢失,降低分析设计特征数据的复杂度工作量更适合以交易为中心的区块链数字货币网络的特征构建。

46.本发明通过特征筛选和降维去除无用特征,提高模型的整体识别效率;其次,特征降维处理方法融合了特征,可以减少维度灾难问题。

47.本发明基于事务属性的纠错机制设计可以中和启发式聚类方法的高估和低估问题,在一定程度上可以应用于事务形式提高了整体模型的识别效果。

图纸说明

48. 图。附图说明图1为本发明实施例公开的一种区块链数字货币的实体身份类型估计方法流程图;

p>

49. 图。图2为本发明实施例公开的区块链数字货币的实体身份类型推断方法的完整流程图;

50.图。图3为本发明实施例公开的生成初始特征数据集的流程图;

51.图。图4为本发明实施例公开的初始特征数据集的特征筛选和降维流程图;

52.图。图5为本发明实施例公开的虚拟地址账户身份类型识别模型的训练与识别流程图;

53. 图。图6为本发明实施例公开的基于启发式纠错方法识别实体身份类型的流程图。

实施例说明

54.为使本发明实施例的目的、技术方案和优点更加清楚,下面结合本发明实施例中的附图,清楚、完整地描述技术本发明实施例中的解决方案,显然,所描述的实施例是本发明实施例的一部分,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

55.下面结合附图对本发明作进一步详细说明:

56.如图1、2所示,本发明提供的一种区块链数字货币的实体身份类型估计方法包括步骤:

区块链的特征

57.s1、根据区块链数字货币的原始交易数据集进行特征提取和降维得到融合特征数据集,得到融合特征数据集;

58.其中,

59.根据区块对链数字货币的原始交易数据集进行特征提取,得到初始特征数据集;

60.对初始特征数据集进行特征筛选和降维处理,得到融合特征数据集;

61.进一步,

62.将区块链数字货币的原始交易数据集解析为地址数据集和交易数据集;

63. 对地址数据集和交易数据集中的数据进行1-to-n映射,输入feature-tools特征生成工具,通过聚合和变换操作自动计算出初始特征数据集。

64.根据信息增益计算初始特征数据集中各特征的特征贡献值,过滤特征贡献值高于预设贡献阈值的特征,得到新的特征数据集;

65.对新的特征数据集进行PCA降维处理,得到融合特征数据集。

66.更进一步,

67.本发明适用于以交易为中心的区块链数字货币身份类型投机,比特币是最典型的以交易为中心的区块链数字货币,因此本发明以比特币数据为研究对象。

68.如图3所示,初始比特币交易数据包括:虚拟地址账户基础json数据和虚拟地址账户交易json数据;格式化,生成虚拟地址账户基本特征信息表(addresses)和虚拟地址账户交易特征信息表(transactions),并将两张表的关系映射成父子关系表,addresses表为父table,而transactions表为子表Table,映射关系为1到n;其次,将这两个表转换为实体集形式的两个关系表,作为feature-tools特征生成工具的输入;然后自动计算基于特征工具的聚合操作和转换操作初始特征数据集。

69.聚合原语:应用于实体集的父子关系,包括“count”统计、“sum”求和、“avg_time_between”平均时间等聚合方式,对父子进行聚合表数据以生成新功能。

70.变换原语:以实体的一个或多个变量为输入,从实体输出一个新变量,应用于实体,常用的变换方法包括“小时”时间戳转换,“time_since_precious " 和 "绝对" 等。

71.如图4所示,根据信息增益对初始特征数据集中的每个特征计算特征贡献值,并根据需要的准确率设置贡献阈值,特征选择贡献值高于阈值的特征生成新的特征数据集;其次,使用pca线性降维算法对新特征数据集进行降维。 pca降维的具体步骤可以总结如下:(1)设置降维后,需要覆盖的特征信息的百分比;(2)@>计算生成的特征个数n覆盖特征信息的百分比;(3)训练pca降维算法,设置维度为n维,降维后输出n维融合特征数据集。

72.s2、融合特征数据集分为训练样本和验证样本,根据训练样本训练虚拟地址账户身份类型识别模型。获取分类器;

73.其中,

74.将训练样本分为训练数据和测试数据;

75.通过训练数据训练虚拟地址账户身份类型识别模型,通过测试数据测试训练出来的虚拟地址账户身份类型识别模型的效果;

区块链的特征

76.@ >循环训练和测试过程,迭代优化虚拟地址账户身份类型识别模型,得到作为分类器的最优模型。

77.进一步,

7 8.如图5所示,降维后的n维融合特征数据集分为训练样本和验证样本。训练样本包括训练数据和测试数据。训练数据用于模型训练,测试数据用于测试模型效果,通过不断的“training-optimization”迭代选择最优模型和训练参数生成分类器。

79.s3、通过分类器验证样本,识别虚拟地址账户的身份类型,获取虚拟地址账户的身份类型表;依次判断样本中的每组数据是否属于类型1到n;

82.过程中,如果判断为是,则该组数据属于对应类型;

83.如果都判断为否,则该组数据为其他类型。

84.如图5所示,分类器检测样本中虚拟地址账户的数量。投机标记类型,生成虚拟地址账户和投机类型信息表。

85.s4、根据虚拟地址账户身份类型表,进行聚类得到多个实体,统计所有虚拟地址账户以及每个实体对应的身份类型;

86.其中,

87.使用启发式聚类方法将虚拟地址账户身份类型表中的虚拟地址账户聚类得到多个实体。

88.进一步,

89.如图6所示,根据虚拟地址账户和推理类型信息表,使用启发式聚类方法对虚拟地址账户进行聚类,得到多个实体hj。

90.s5、实体的身份类型是根据实体的每种身份类型的虚拟地址账户数量的比例来确定的。

91.其中,

92.分别计算实体各身份类型的虚拟地址账户占比,得到占比最大的身份类型和

对应比例;

93.判断比例是否大于0.5,如果判断为是,则推断该实体的身份类型是这个比例最大的身份类型确定,将实体的所有虚拟地址账户确定为占比最大的身份类型。

94.如果判断为否,则认为无法推断实体的虚拟地址账户身份类型。

95.进一步,

区块链的特征

96.如图6所示,统计属于同一实体的虚拟地址账户的推定类型,计算各类型实体的虚拟地址账户占比为h

jn

/|hj|,计算比值最大的类mj,记录对应的类型nj,判断mj是否大于0.5,如果mj大于0.5,全部推断实体的虚拟地址账户类型为nj,否则认为无法推断实体的虚拟地址账户身份类型。

97.本发明还提供了一种区块链数字货币实体身份类型估计系统,包括:数据准备模块、模型训练模块、虚拟地址账户身份类型初步估计模块、启发式纠错推测模块;

98.数据准备模块:

99.根据区块链数字货币的原始交易对数据集进行特征提取和降维,得到融合特征数据集和融合特征数据集;

100.模型训练模块,用于:

101.融合特征数据集分为训练样本和验证样本,根据训练样本训练虚拟地址账户身份类型识别模型得到分类器;

102.虚拟地址账户身份类型初步推断模块,用于:

103.通过分类器识别虚拟地址账户身份类型,得到虚拟地址账户身份类型表;

104.启发式纠错和推测模块,用于:

105.根据虚拟地址账户身份类型表进行聚类,获取多个实体,统计所有实体虚拟地址账户和对应的身份类型;

106.根据实体的每种身份类型的虚拟地址账户数量的比例,确定实体的身份类型。

107.本发明的优点:

108.(1)利用区块链数字货币的原始交易数据,自动化生成特征,通过特征筛选、数据降维等构建样本特征数据集,使用机器学习分类方法推测区块链虚拟地址账户的身份类型,然后利用区块链启发式聚类方法设计基于投票的纠错机制推测区块链数字货币的实体身份类型,从而完成一个实体身份类型适用于以交易为中心的区块链数字货币的推理方法,提高实体身份类型推理的效果。

109.(2)@>基于原始交易数据的自动特征提取方案,可以提高信息数据的利用率,防止关键信息丢失,减少分析和设计特征的工作量data 更适合以交易为中心的区块链数字货币网络的特征构建工作。

110.(3)通过特征筛选和降维工作,剔除无用的特征,提高模型的整体识别效率;其次,特征降维处理方法融合了特征,可以减少维度灾难的问题。

111.(4)基于交易属性的修正错误机制的设计可以中和启发式聚类方法的高估和低估,交易形式的应用可以提高识别效果对整体模型有一定的影响。

112.以上所述仅为本发明的较佳实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,做任何修改,

等效替换、改进等均应包含在本发明的保护范围内。