<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: Slope one:简单高效的推荐算法</title>
	<atom:link href="http://www.fuchaoqun.com/2008/09/slope_one/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.fuchaoqun.com/2008/09/slope_one/?utm_source=rss&amp;utm_medium=rss&amp;utm_campaign=slope_one</link>
	<description></description>
	<lastBuildDate>Mon, 26 Jul 2010 00:44:40 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
	<item>
		<title>By: 超群.com</title>
		<link>http://www.fuchaoqun.com/2008/09/slope_one/comment-page-1/#comment-96</link>
		<dc:creator>超群.com</dc:creator>
		<pubDate>Wed, 08 Apr 2009 09:03:54 +0000</pubDate>
		<guid isPermaLink="false">http://chaoqun.17348.com/?p=57#comment-96</guid>
		<description>@iceberg

:)我不是专业做数据挖掘的，Web开发工程师是我的职业，所以我的见解可能有误。

rb = (n * (ra - R(A-&gt;B)) + m * (rc - R(C-&gt;B)))/(m+n)

slope one分析的对象是两个事物（比如两首歌），比如你喜欢戏剧，如果80％喜欢戏剧的人都喜欢“千里之外”，那么slope one可能会帮你推荐出来，但‘全国80%的人都喜欢“千里之外”，那我喜欢的概率是多少呢？‘这个不行，你的兴趣爱好和全国80%喜欢千里之外没关系。

slope one和关联规则都比较关注两个事物同时出现的次数，我以此相比较它们。</description>
		<content:encoded><![CDATA[<p>@iceberg</p>
<p> <img src='http://www.fuchaoqun.com/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> 我不是专业做数据挖掘的，Web开发工程师是我的职业，所以我的见解可能有误。</p>
<p>rb = (n * (ra &#8211; R(A->B)) + m * (rc &#8211; R(C->B)))/(m+n)</p>
<p>slope one分析的对象是两个事物（比如两首歌），比如你喜欢戏剧，如果80％喜欢戏剧的人都喜欢“千里之外”，那么slope one可能会帮你推荐出来，但‘全国80%的人都喜欢“千里之外”，那我喜欢的概率是多少呢？‘这个不行，你的兴趣爱好和全国80%喜欢千里之外没关系。</p>
<p>slope one和关联规则都比较关注两个事物同时出现的次数，我以此相比较它们。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: iceberg</title>
		<link>http://www.fuchaoqun.com/2008/09/slope_one/comment-page-1/#comment-95</link>
		<dc:creator>iceberg</dc:creator>
		<pubDate>Wed, 08 Apr 2009 03:43:18 +0000</pubDate>
		<guid isPermaLink="false">http://chaoqun.17348.com/?p=57#comment-95</guid>
		<description>您不觉得slope one这个算法与关联规则相比有点问题吗？就是用平均值的方法掩盖了个性。

比如说全国80%的人都喜欢“千里之外”，那我喜欢的概率是多少呢？
用slope one得出的结论肯定是我也很喜欢“千里之外”。
但关联规则就不一定，它会分析我的历史下载记录，找到我可能喜欢的歌曲。假设我就是个喜欢独立歌曲（或者戏剧）的人，也能找到相应的喜欢的歌。
原因就是因为关联规则关注的是条件概率，而slope one 好像是只统计全局的量，掩盖了个性。</description>
		<content:encoded><![CDATA[<p>您不觉得slope one这个算法与关联规则相比有点问题吗？就是用平均值的方法掩盖了个性。</p>
<p>比如说全国80%的人都喜欢“千里之外”，那我喜欢的概率是多少呢？<br />
用slope one得出的结论肯定是我也很喜欢“千里之外”。<br />
但关联规则就不一定，它会分析我的历史下载记录，找到我可能喜欢的歌曲。假设我就是个喜欢独立歌曲（或者戏剧）的人，也能找到相应的喜欢的歌。<br />
原因就是因为关联规则关注的是条件概率，而slope one 好像是只统计全局的量，掩盖了个性。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: 超群.com</title>
		<link>http://www.fuchaoqun.com/2008/09/slope_one/comment-page-1/#comment-80</link>
		<dc:creator>超群.com</dc:creator>
		<pubDate>Wed, 25 Mar 2009 02:50:51 +0000</pubDate>
		<guid isPermaLink="false">http://chaoqun.17348.com/?p=57#comment-80</guid>
		<description>＠武影：

下面的文字仅是我个人看法，没有怎么研究数学，所以可能有谬。

我们从加权公式看起：rb = (n * (ra - R(A-&gt;B)) + m * (rc - R(C-&gt;B)))/(m+n)，如果同时给A、B打过分的用户远远大于给C、B打过分的用户，那么A、B的权重n就非常的大，rb ≈ ra - R(A-&gt;B)/n，用户对B打分的值主要由同时对A、B打分过的用户决定。这就有点类似关联规则了，A、B频繁出现在一起，那么它们的关联性可能就高一些。

slope one引入了加权平均，所以它的结果可能要比简单的关联规则要好一些。

2007年在看一些股票技术方面的书，感觉核心就是平均值可以掩盖一切波动，这可能也是slope one算法的核心吧。

另外从一些测试的结果看，slope one算法可能是“性价比”最高的一种算法，运算简单，效果还很不错。

现在，推荐系统算法都盯着&quot;SVD&quot;，但已经变的一塌糊涂了，比如类RSVD，也许有效，但很“丑陋”。

至于“兴趣元素”，可能要和具体业务联系，比如音乐，我们分析听歌的次数、收藏的歌曲、评论的歌曲等等，这个是业务的范畴。

感谢你的留言，淘宝的推荐做的不错，我们的推荐系统近期可能也要上线了。</description>
		<content:encoded><![CDATA[<p>＠武影：</p>
<p>下面的文字仅是我个人看法，没有怎么研究数学，所以可能有谬。</p>
<p>我们从加权公式看起：rb = (n * (ra &#8211; R(A->B)) + m * (rc &#8211; R(C->B)))/(m+n)，如果同时给A、B打过分的用户远远大于给C、B打过分的用户，那么A、B的权重n就非常的大，rb ≈ ra &#8211; R(A->B)/n，用户对B打分的值主要由同时对A、B打分过的用户决定。这就有点类似关联规则了，A、B频繁出现在一起，那么它们的关联性可能就高一些。</p>
<p>slope one引入了加权平均，所以它的结果可能要比简单的关联规则要好一些。</p>
<p>2007年在看一些股票技术方面的书，感觉核心就是平均值可以掩盖一切波动，这可能也是slope one算法的核心吧。</p>
<p>另外从一些测试的结果看，slope one算法可能是“性价比”最高的一种算法，运算简单，效果还很不错。</p>
<p>现在，推荐系统算法都盯着&#8221;SVD&#8221;，但已经变的一塌糊涂了，比如类RSVD，也许有效，但很“丑陋”。</p>
<p>至于“兴趣元素”，可能要和具体业务联系，比如音乐，我们分析听歌的次数、收藏的歌曲、评论的歌曲等等，这个是业务的范畴。</p>
<p>感谢你的留言，淘宝的推荐做的不错，我们的推荐系统近期可能也要上线了。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: 武影</title>
		<link>http://www.fuchaoqun.com/2008/09/slope_one/comment-page-1/#comment-77</link>
		<dc:creator>武影</dc:creator>
		<pubDate>Tue, 24 Mar 2009 15:41:01 +0000</pubDate>
		<guid isPermaLink="false">http://chaoqun.17348.com/?p=57#comment-77</guid>
		<description>此算法模型作为推荐系统感觉缺了一些更核心的元素，推荐应该是一种共同的兴趣或者说价值取向的传递。

首先找出共同的兴趣包括哪些元素，并把AB、BC这种共同兴趣匹配度纳入到推荐系统:
用户1对A和B同时打分，无论分值多少，可以作为A和B之间共同的兴趣传递的一种结果，不是唯一的哦，按照Dont let me think，我觉得可以在浏览行为、订单、评论、收藏夹等等方面都纳入到共同的兴趣这个元素中。

其次，在共同的兴趣匹配度下，按评分平均差排序。</description>
		<content:encoded><![CDATA[<p>此算法模型作为推荐系统感觉缺了一些更核心的元素，推荐应该是一种共同的兴趣或者说价值取向的传递。</p>
<p>首先找出共同的兴趣包括哪些元素，并把AB、BC这种共同兴趣匹配度纳入到推荐系统:<br />
用户1对A和B同时打分，无论分值多少，可以作为A和B之间共同的兴趣传递的一种结果，不是唯一的哦，按照Dont let me think，我觉得可以在浏览行为、订单、评论、收藏夹等等方面都纳入到共同的兴趣这个元素中。</p>
<p>其次，在共同的兴趣匹配度下，按评分平均差排序。</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: 基于Slope One的相关歌曲推荐算法 &#187; 超群.com的博客</title>
		<link>http://www.fuchaoqun.com/2008/09/slope_one/comment-page-1/#comment-56</link>
		<dc:creator>基于Slope One的相关歌曲推荐算法 &#187; 超群.com的博客</dc:creator>
		<pubDate>Tue, 03 Feb 2009 10:56:36 +0000</pubDate>
		<guid isPermaLink="false">http://chaoqun.17348.com/?p=57#comment-56</guid>
		<description>[...] 对于Slope One算法，不熟悉的可以参照我之前的文章：Slope one:简单高效的推荐算法，已经被很多人证明有很好的推荐效果。 [...]</description>
		<content:encoded><![CDATA[<p>[...] 对于Slope One算法，不熟悉的可以参照我之前的文章：Slope one:简单高效的推荐算法，已经被很多人证明有很好的推荐效果。 [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: slope one算法在Netflix Prize上的表现 &#187; 超群.com的博客</title>
		<link>http://www.fuchaoqun.com/2008/09/slope_one/comment-page-1/#comment-47</link>
		<dc:creator>slope one算法在Netflix Prize上的表现 &#187; 超群.com的博客</dc:creator>
		<pubDate>Tue, 06 Jan 2009 09:41:18 +0000</pubDate>
		<guid isPermaLink="false">http://chaoqun.17348.com/?p=57#comment-47</guid>
		<description>[...] one算法在Netflix Pirze上的测试，关于slope one算法可以参考我之前写的文章:Slope one:简单高效的推荐算法，Netflix [...]</description>
		<content:encoded><![CDATA[<p>[...] one算法在Netflix Pirze上的测试，关于slope one算法可以参考我之前写的文章:Slope one:简单高效的推荐算法，Netflix [...]</p>
]]></content:encoded>
	</item>
</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->