图表告诉我们,预测点离拟合线的距离。
另一个我们必须创建的视觉效果的例子是“主成分分析”(Principal Component Analysis)。如果您想深入了解PCA,可以阅读下面链接中的文章。 Practical Guide to Principal Component Analysis (PCA) in R & Python
https://www.analyticsvidhya.com/blog/2016/03/practical-guide-principal-component-analysis-python/
这是在Rstudio中的Iris数据集:
这里没有太多信息来获取关于模型的有价值的见解。
想了解更多关于向量机的信息,可以阅读下面这篇文章: Understanding Support Vector Machine algorithm from examples (along with code)
https://www.analyticsvidhya.com/blog/2017/09/understaing-support-vector-machine-example-code/
另一方面,该图向我们展示了一个清晰的物种的分类边界。
五、讲故事的最佳实践
现在你已经知道可以用“讲故事”的方式来解释我们的观点,当你自己解决这个问题是,我将给你一些实用的提示:
始终在图中标记轴并给出绘图标题;
必要时使用图例;
使用眼睛看起来较浅并且比例适中的颜色; 避免添加不必要的细节,比如不具备良好可读性的背景或主题; 只有一个点可以根据水平和垂直位置同时编码两个定量值;
如何你正在进行时间序列的编码,不要使用点进行可视化。 六、结束语
讲故事的方式不仅仅是它的用法。它能帮你从你过去遗漏的数据中发掘新见解。数字永远无法清晰的描述特征和数据之间的关系,故事和图表将是很好的替代。
本文中我们已经详细阐述了故事是如何在各种途径中被使用的。从它们在模型构建步骤中的使用方式开始,我们逐渐了解哪些图表适合哪些特定的数据类型。
希望你读完这篇文章很开心。 期待听到你的数据故事!
原文标题:
The Art of Story Telling in Data Science and how to create data stories?
原文链接:
https://www.analyticsvidhya.com/blog/2017/10/art-story-telling-data-science/?utm_source=11stepsBItoDSarticle&utm_medium=blog