松盛号

松盛号

旅游推荐系统毕业设计总结(包含旅游信息爬取、算法应用和旅游推荐系统实现) 旅游景点的app软件

旅游推荐系统毕业设计总结(包含旅游信息爬取、算法应用和旅游推荐系统实现)

哇塞,大学本科四年的时光就这样结束了,虽然做毕设的整个过程并不是特别煎熬,也没有像别人一样熬夜写代码,但是通过毕设我确实了解很多计算机相关知识,现在进行一个简单的总结:

最近更新这个系统,具体页面展示在这一片博客:

旅游推荐系统更新版本_#Amark的博客-CSDN博客

整个推荐模型的设计和实现的大体结构如下:

通过从数据库或csv文件中获取数据源,首先把数据进行数据清洗、数据集成、数据规约和模型鉴定,紧接着将数据与对应模式库的规则进行模式匹配,从而选择合适的算法进行模型训练和学习,并进行算法评估和对新出现的数据进行存储和学习,在上述过程中对所有操作进行日志管理和检验是否具备可操作权限,最后输出用户所期望的数据信息和内容。该模型能应用在景点分类、经费计算、路径规划、酒店推荐、特征提取、美食推荐。

现在目录上的章节如果有时间会进行详细的文章编写,目前暂时只完成了网络爬虫部分。了解基于django的web开发

由于本次在研究中需要对模型的应用进行一个更好的可视化展示效果,我做了两个简单的开发界面,第一个是旅游界面的推荐,第二个是推荐后得到的结果。其具体Django教程在:快速入门Django开发教程(旅游推荐系统实现教程)在做界面的时候主要是体验了一下循环渲染吧。{%%}使用了json做了一下前后端数据的传输使用ajax做了异步传输还有如何快速获取网页的代码,当然这个只适用于日常的学习和研究。模型的实现和应用

学会了python的基本使用,包含其中的numpy、pandas、jieba、sqlite、re等各式各样的库

自从使用了python以后,才发现python是真的很好用哈,基本可以使用python进行编程了。了解到python中的字典、元组的使用并不局限于一维的方法,并能结合字典和元组一起使用。在django开发中理解了class的使用和函数的定义和引用jieba用来处理的分词效果是真的很好哦numpy用来数据和矩阵的处理,真的很方便,基本上和pandans、matplotlib一起使用了接触了一种新的数据库sqlite,了解了基本的增删改查。接触到正则表达式,主要用了信息提取和信息删除还有如何创建csv文件、遍历文件接触到一种新的库管理工具homebrew开始接触算法的应用和创新,在毕设设计到了TF-IDF算法、朴素贝叶斯分类、蚁群算法使用TF-IDF是进行的关键词提取1.将每一篇景点介绍文本进行分词处理2.求解各篇文章词的TF和IDF3.计算各篇文章各词的TF-IDF4.根据权重值对各篇文章中词进行降序排序,选取权重值前20的词做为该景点的关键特征

 使用朴素贝叶斯来进行景点分类1.分解出各景点的关键特征并确定训练数据对应的特征分类。2.计算每个景点类别中对应特征的条件概率。3.计算景点所属各类别概率。4.选取概率值最高的类别作为该景点的分类。景点分类标签:

现代风情、历史风情、当地特色、博物馆、动物园、游乐中心、历史伟人、当地公园、植物园、国内名校、购物中心、当地剧院、当地古镇、红色文化、体育公园、宗教圣地景点分类研究结果

在180个热门景点中有博物馆8个、当地动物园8个、当地公园17个、当地古镇4个、当地剧院3个、当地特色48个、购物中心8个、国内名校4个、红色文化6个、历史风情28个、历史伟人8个、体育公园3个、游乐中心17个、植物园3个、宗教圣地6个、现代风情10个。

使用蚁群算法用来进行景点的路径规划•根据景点经纬度转换成对应的景点距离•蚂蚁从景点i转到景点j的概率•更新蚂蚁从景点i到景点j的信息素浓度•根据每日最佳游玩时间,和景点花费时间,分解最优路径得出每日景点规划

这些算法还是真的神奇,佩服数学的神奇!学会了网络爬虫,本次毕设使用的是beautifulsoup4

第一次爬虫额,成功的爬取到了携程网的酒店、景点、美食信息。

其中本次爬虫的主要思想是:首先是找到携程网url的编写规律,然后根据规律使用beautifulsoup4对所需的html语言中的信息提取,最后就是封装处理。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至lizi9903@foxmail.com举报,一经查实,本站将立刻删除。

上一篇 没有了

下一篇没有了