当前位置: 首页 > news >正文

做网站第一步要学什么wordpress %link

做网站第一步要学什么,wordpress %link,网页设计师培训教程,wordpress博客备案最近在做一个文本挖掘项目时遇到一个很实际的问题#xff1a;文本里对地铁线路名称的表述很杂乱#xff0c;如何统一。 比如#xff0c;地铁1号线#xff0c;可能表述为1号线、地铁1号线、轨道1号线、轨道交通1号线、1号地铁、一号线、地铁一号线、轨道一号线、轨道交通一…最近在做一个文本挖掘项目时遇到一个很实际的问题文本里对地铁线路名称的表述很杂乱如何统一。 比如地铁1号线可能表述为1号线、地铁1号线、轨道1号线、轨道交通1号线、1号地铁、一号线、地铁一号线、轨道一号线、轨道交通一号线、一号地铁想统一为“地铁1号线”。 前提是要先建立一个地铁线路名称词典把上述可能的线路名表述都纳入用来准确分词。 import jieba # 分词 from fnmatch import fnmatch # 通配符# 定义函数用来统一地铁线路名称格式 # 投入参数是一个已经分好词的列表返回一个处理好的字符串 def unify_line_name(mylist):num_dict {1:一, 2:二, 3:三, 4:四, 5:五, 6:六, 7:七, 8:八, 9:九, \10:十, 11:十一, 12:十二, 13:十三, 14:十四, 15:十五, 16:十六, 17:十七, \18:十八, 19:十九, 20:二十, 21:二十一, 22:二十二, 23:二十三}for i in range(len(mylist)):if fnmatch(mylist[i], *号线) or fnmatch(mylist[i], *号地铁):# 数字必须从大到小倒着遍历否则影响后面in判断# 比如“二十三”二、十、三、二十、十三都包含在字符串内# 所以要倒着遍历先识别匹配最大的数字就不会错了最后别忘了break跳出循环for j in range(len(num_dict),0,-1):if str(j) in mylist[i] or num_dict[j] in mylist[i]:mylist[i] 地铁 str(j) 号线breakreturn .join(mylist) # 加载自定义的线路名称词典 jieba.load_userdict(mydict_line.csv) # 原始字符串 mystr 可是地铁四号线车厢太挤了 # 分词 mylist jieba.lcut(mystr, cut_all False) print(mylist) # 用函数处理线路名称 mystr_new unify_line_name(mylist) print(mystr_new)
http://www.lebaoying.cn/news/61365.html

相关文章:

  • 用html5做的网站建筑工程机械人才培训网
  • 站长工具域名备案查询学生免费舆情监测平台官网
  • 汽车网站制作泰安中呼网站建设有限公司 概况
  • 上国外网站 dns洛阳建筑公司排名
  • 营销型网站建设实战》wordpress 登录页
  • 网站建设实训心得与建议网站资讯建设
  • dw做网站怎么发布移动网站开发技术
  • 用什么l软件做网站了网站优化及推广
  • 建设部网站监理工程师报名在个人网站上做电商营业执照
  • 自己的公网ip可以做网站珠海做网站哪家好
  • 无锡 网站 seo 优化上海大学生兼职做网站
  • 深圳网站设计服制作公司网页英语作文
  • 宜昌电子商城网站建设alexa排名软件
  • 深圳网站建设制作厂家长沙网站制作服务
  • 可以做生存分析的网站珠宝网站建设
  • 如何做网络推广网站遵义相亲群
  • 视频网站如何推广建设网站明细报价表
  • 可以建设网站的公司哪些网站做高尔夫旅游
  • 用前端做的比较酷的网站可用的在线网页代理
  • 汽车美容网站开发wordpress调用时间
  • 网站常用字体江门广告网站推广技巧
  • 网站开发与维护的工资高质量的丹阳网站建设
  • 青浦网站设计做外贸的都有哪些网站
  • 网站建设 商业价值手机网站整站源码下载
  • 建设中英文网站wordpress默认后台
  • 企业网站建设费用摊销咨询公司起名用字大全
  • 北京城乡建设官方网站上海单位名称大全
  • 建设网站的风格福建省公司注册网上核名
  • 利用h5网站做app龙华附近网站建设
  • 电脑网站搜索如何做潍坊网站外包