相关动态
语料库及其基本操作
2024-11-10 17:29

语料库及其基本操作杨林伟烟台大学外语教育技术研究中心语料库的概念及其发展简述自建小型语料库语料库工具、软件教学实践与应用1234语料库的概念及其发展简述1Acorpusisacollectionofpiecesoflanguagetextinelectronicformselectedaccordingtoexternalcriteriatorepresentasfaraspossiblealanguageorlanguagevarietyasasourceofdataforlinguisticresearch.(Sinclair,1991)acollectionofsampledtexts,writtenorspoken,inmachinereadableformwhichmaybeannotatedwithvariousformsoflinguisticinformation.(McEneryetal.2006)语料库的定义语料库的概念及其发展简述1alargecollectionofwell-sampledandprocessedelectronictexts,onwhichlanguagestudies,theoreticalorapplied,canbeconductedwiththeaidofcomputertools.ByBFSUCRGmembers语料库的定义语料库的概念及其发展简述11959:SEU(SurveyofEnglishUsage)thefirstattempttoprovideanongoingcollectionofpresent-dayEnglish…wasaprecursoroflatercorpora

语料库及其基本操作

suchastheBritishNationalCorpusandtheAmericanNationalCorpus.1961:TheBrownCorpuswasthefirstcomputer-readablegeneralcorpusoftextspreparedforlinguisticresearchonmodernEnglishatBrownUniversity.语料库百万词级语料库的概念及其发展简述11970s:TheLancaster-Oslo/BergenCorpus(LOBCorpus)wascompiledtoprovideaBritishcounterparttotheBrownCorpus.1975:TheLondonLundCorpus(LLC)wasthecomputerisedspokenpartofSEU,usedasthebasisforthefamousComprehensiveGrammar(Quirketal.1985).语料库百万词级语料库的概念及其发展简述11980s:COBUILD(Collins-BirminghamUniversityInternationalLexicalDatabase).In1991,thesuccessoftheCOBUILDledtothedevelopmentofalarge

monitorcorpus,theBankofEnglish.

1980s:LONGMAN/LANCSTERCorpus.AspartoftheLongmanCorpusNetwork,theLongman/LancasterCorpusisnotavailableforpublicaccess.

语料库千万词级语料库的概念及其发展简述11980s—early1990s:BNC(BritishNationalCorpus)1亿1990s:COCA(TheContemporaryAmericanEnglish)4.5亿语料库亿词级语料库的概念及其发展简述1Late1990s—2002:ICLE(TheInternationalCorpusofLearnerEnglish)Late1990s:CLEC(ChineseLearnerEnglishCorpus)HKUSTLearnerCorpusSeeMoreCorpora:http://www.lancaster.ac.uk/fass/projects/corpus/cbls/corpora.asp热点:学习者语料库语料库的概念及其发展简述1热点:双语语料库TheBFSU(BeijingForeignStudiesUniversity)Chinese-EnglishParallelCorpuscontains30millionwords.PresentlyitisthelargestparallelcorpusofEnglishandChinese.Thecorpusiscomposedoffoursubcorpora,i.e.BalancedCorpus,TranslationCorpus,BilingualSentencesCorpusandCorpusforSpecificPurpose.语料库的概念及其发展简述1热点:网络语料库WaCWfCWa/fC检索工具、软件语料库工具、软件2WordSmithToolsMonoConc/ParaConcAntConc:freeware,copyleftXaira:BNCCQPWeb:SketchEngine,BFSUCQPWebWebCorp检索工具、软件语料库工具、软件2检索工具、软件语料库工具、软件2KWICWordlistandCollocationN-gramPractice1检索工具、软件语料库工具、软件2Practice1语料库标注工具语料库工具、软件2StanfordPOStaggerTreeTaggerCLAWS5语料库标注工具语料库工具、软件2StanfordPOStaggerTreeTaggerCan_MDyou_PPcan_MDa_DTcan_NNas_INa_DTcanner_NNcan_MDcan_MDa_DTcan_NN?_SENTCan/MDyou/PRPcan/MDa/DTcan/MDas/INa/DTcanner/NNcan/MDcan/MDa/DTcan/MD?/.11/13=84.69/13=69.2Practice2语料库文本处理工具语料库工具、软件2EditpadProPowerGrepRegexBuddyRegexRegularexpression正则表达式wordlessbaw*bd+bw{6}b语料库文本处理工具语料库工具、软件2Practice3RemovethetagsRemovethewordsCollectallthesentencesofthestructure:

    以上就是本篇文章【语料库及其基本操作】的全部内容了,欢迎阅览 ! 文章地址:http://zleialh.xhstdz.com/news/2613.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://zleialh.xhstdz.com/mobile/ , 查看更多   
最新文章
数字艺术革命:3D虚拟展览,为艺术爱好者打开新世界
nbsp;nbsp;nbsp;nbsp;便利性:无界限的艺术探索,3D虚拟艺术展览通过高质量的3D扫描技术,将实体艺术品转化为
AI智能营销领域的卓越引领者
作为 AI 智能营销业务的先锋企业,专注于为客户打造智能化的营销解决方案,助力其在激烈的市场竞争中脱颖而出。我们的核心优势在
百度蜘蛛池收录:揭秘蜘蛛池做排名解析技巧,助力网站快速崛起
揭秘蜘蛛池收录技巧,解析如何利用蜘蛛池快速提升网站排名,助力网站快速崛起。本文目录导读:了解蜘蛛池蜘蛛池做排名解析技巧随
网站排名优化,专治周a斯受欢迎的秘诀
网站排名优化是提升网站在搜索引擎中排名的关键。针对周a斯受欢迎的秘诀,关键在于提供高质量、有价值的内容,同时注重网站结构
杭州SEO优化,助您网站飞跃,企业腾飞之道
杭州SEO网站优化,专业提升网站排名,助力企业快速提高网络曝光度,抢占市场份额,实现线上业绩腾飞。通过科学策略,精准关键词
#### 智能创作发布到抖音怎么不存在流量
在数字化时代的浪潮中人工智能()的应用已经渗透到各个领域其中智能创作更是以其高效、便捷的特性受到了广大创作者的青睐。它不
国际站:SEO Checker诊断工具助力商家诊断详情页,提升seo效果
国际站商家看过来:众所周知,一个优质的商品描述,可以提升买家转化的同时,还可以带来更多免费流量,从而让商家获得更多询盘和
【富蕴网站优化】在网站优化中有哪些常用的网站推广方式?
1、,百度,google的优化,针对,音乐,mp3下载,电影、游戏等一级,二级,甚至关键字优化。Seo介绍的网站很多,就不在这里重复
公众号简单爬虫--把公众号文章全部转载到网站(二)
根据上一篇的方法,我们得到了一个获取列表信息的地址,而且是用get方法就可以的地址.那么事情就变得很简单了,就是常规的爬取信息
相关文章