如果使用一个以上的特征,那么,线性模型的能力就会真正强大起来,这种使用多个特征的线性回归叫做多元线性回归(multiple linear regression)。 房屋的最终价格大概还依赖于很多其他的因素,例如,当前的房屋抵押率、市场上未售房屋的数量,等等。可以把这些因素作为变量来进行编码,每一个因素的重要程度就是这些变量的权重,如下面的方程所示: 参考莱维特(Levitt)和杜布尼(Dubner)在《魔鬼经济学》中的这段有趣的叙述,我在2011年5月16日的博客中写了博文《从用词中挖掘知识》(http://blog.sina.com.cn/s/blog_72d083c70100qwdq.html)[5],在这篇博文中,我强调说明:“词汇中包含着非常丰富的内容,从中我们可以发现挖掘出很多知识来。在自然语言处理中,我们千万不可忽视词汇的研究。” 网友们热烈评论我的博文,他们说,没有想到广告中的用词竟然会影响到房地产销售的结果,语言的词汇是多么的重要啊! 在网友们的评论和鼓励下,我对于词汇研究的兴趣更加高涨了,为了在理论上加深我对于词汇重要性的认识,我又进一步从众多的文献中考察了前辈语言学家对于词汇研究重要性的论述。 (责任编辑:admin) |