回归算子分类与多项式二项分类
你好,
我有一个多类方法,使用SVM (mySVM)和一个操作符来实现多分类。问题在于,“Classification by Regression Operator”和“Polynomial by Binomial Classification”这两种可能的算子对置信度值的结果是不同的:
1)回归算子分类:置信值元素(-∞,1)。这似乎是到超平面的带符号距离。这是正确的吗?为什么没有大于1的值?(我的意思是它处于边缘。它是否依赖于核函数?)
2)二项分类多项式:置信值元素[0,1]。这是某种概率吗?定义呢?
不幸的是,我没有找到任何关于如何定义置信度值的提示(关于使用的操作符或SVM实现)。
为了使用RapidMiner和输出,我需要清楚地了解参数、置信度值和对RapidMiner操作符的依赖关系。
如果你能帮我解决这些问题,我会很高兴的!
最好的问候,
马克
PS:我已经在另一个类别中打开了一个类似的线程(https://rapid-i.com/rapidforum/index.php/topic,9418.msg31536.html)
我有一个多类方法,使用SVM (mySVM)和一个操作符来实现多分类。问题在于,“Classification by Regression Operator”和“Polynomial by Binomial Classification”这两种可能的算子对置信度值的结果是不同的:
1)回归算子分类:置信值元素(-∞,1)。这似乎是到超平面的带符号距离。这是正确的吗?为什么没有大于1的值?(我的意思是它处于边缘。它是否依赖于核函数?)
2)二项分类多项式:置信值元素[0,1]。这是某种概率吗?定义呢?
不幸的是,我没有找到任何关于如何定义置信度值的提示(关于使用的操作符或SVM实现)。
为了使用RapidMiner和输出,我需要清楚地了解参数、置信度值和对RapidMiner操作符的依赖关系。
如果你能帮我解决这些问题,我会很高兴的!
最好的问候,
马克
PS:我已经在另一个类别中打开了一个类似的线程(https://rapid-i.com/rapidforum/index.php/topic,9418.msg31536.html)
0
答案
~马丁
德国多特蒙德
不幸的是,缺少对输出和操作符的清晰描述和定义,但是我需要它,以便科学地正确工作。我期待着RapidMiner的官方回答,但目前还没有任何反应。
我想会有比我的帖子更正式的答案,除非你在support.www.kenlockard.com上提问,但这需要许可证。我受雇于RapidMiner;这样就算是正式了?
你能做的就是看一下源代码。按回归运算符分类的资料载于:
https://github.com/rapidminer/rapidminer-studio/blob/master/src/main/java/com/rapidminer/operator/learner/meta/ClassificationByRegression.java
我们在这里看到了这样的评论: 我检查了附带的示例过程。显然,信心(我的)是[0,1],但信心(Rock)不是。出于某种原因,只有一个置信度是“正确的”。一旦我有更多的时间,我会更深入地检查代码
~马丁
德国多特蒙德
注释也写在文档中。我对不同的置信度输出也有同样的问题:只有一个设置“正确”(但只有1 ?)。
如果置信度值在[0,1]中,置信度值的定义是什么?(我想避免查看实现,但它似乎是必要的)
每个算法的计算值不同。对于一个k-nn,它是这个类的邻居的分数(在未加权的情况下)。对于SVM,该值取决于到分离超平面的距离。
德国多特蒙德
为什么相同的SVM算法的置信度值,但不同的操作员在不同的范围内(这是没有记录的)?
在libSVM的情况下,有可能将概率估计为置信度,而不是到超平面的距离。不幸的是,关于算法等的置信度值的具体含义没有记录。
我认为我必须研究实施,因为学术支持也没有帮助。
感谢目前为止,我将非常高兴任何进一步的支持。
你好@mschmitz
有谁知道classficationbyregression操作符是在哪个科学基础上实现的吗?是否有一篇论文详细描述了这种集成方法是如何工作的,尽管上面提到的礼物代码?
提前感谢您的回答!
最好的问候!
德国多特蒙德
非常感谢您的快速回复!
@IngoRM你能帮我写封推荐信吗?
最好的问候!