<HTML dir=ltr><HEAD><TITLE>Re: [Corpora-List] Application for lemmatising corpora</TITLE>
<META http-equiv=Content-Type content="text/html; charset=unicode">
<META content="MSHTML 6.00.2900.3059" name=GENERATOR></HEAD>
<BODY>
<DIV id=idOWAReplyText82496 dir=ltr>
<DIV dir=ltr><FONT face=Arial color=#000000 size=2>Hi all,</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV dir=ltr><FONT face=Arial size=2>Thanks, I&nbsp; have been looking at the applications suggested. Unfortunately, what I'm looking for is so simple that it might not be something that many people&nbsp;actually use. My texts are untagged, and I'd like to keep them that way for the moment. I actually want the lemmas to be inserted right there in the text, so you get for example; 'Yesterday&nbsp;I<EM> GO to the market.</EM>'&nbsp; </FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV dir=ltr><FONT face=Arial size=2>I guess what I'm looking for is a kind of find/replace application that can read off a file of (lemmatising) replacements like GO&gt;go, went, gone, going...!</FONT></DIV>
<DIV dir=ltr>&nbsp;</DIV>
<DIV dir=ltr><FONT face=Arial size=2>Apologies for not making this clearer!</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV dir=ltr><FONT face=Arial size=2>Duncan Hunter</FONT>&nbsp;</DIV></DIV>
<DIV dir=ltr><BR>
<HR tabIndex=-1>
<FONT face=Tahoma size=2><B>From:</B> owner-corpora@lists.uib.no on behalf of jasper holmes<BR><B>Sent:</B> Fri 23/03/2007 09:58<BR><B>To:</B> corpora@uib.no<BR><B>Subject:</B> Re: [Corpora-List] Application for lemmatising corpora<BR></FONT><BR></DIV>
<DIV>
<P><FONT size=2>You could try WMatrix: <A href="http://www.comp.lancs.ac.uk/ucrel/wmatrix/">http://www.comp.lancs.ac.uk/ucrel/wmatrix/</A><BR>You need to get a username (one month free trial), and then you do it<BR>online. This does tagging and lemmatising and also some analysis<BR>(frequencies, concordances, key words).<BR><BR>Jasper<BR><A href="http://go.warwick.ac.uk/BAWE">http://go.warwick.ac.uk/BAWE</A><BR><BR><BR>On 3/22/07, Oliver Strunk &lt;strunk@ub.edu&gt; wrote:<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; Maybe the TreeTagger from IMS Stuttgart?<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; <A href="http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/DecisionTreeTagger.html">http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/DecisionTreeTagger.html</A><BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; It is available for linux and windows; the output includes POS and<BR>&gt; lemmatized text and can easily be converted.<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; Oliver Strunk<BR>&gt;<BR>&gt; LADA &#8211; University of Barcelona<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; From: owner-corpora@lists.uib.no [<A href="mailto:owner-corpora@lists.uib.no">mailto:owner-corpora@lists.uib.no</A>] On<BR>&gt; Behalf Of Hunter, Duncan<BR>&gt; Sent: Thursday, March 22, 2007 11:45 PM<BR>&gt; To: corpora@uib.no<BR>&gt; Subject: [Corpora-List] Application for lemmatising corpora<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; Hi All,<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; Could anybody suggest a small, downloadable and free application for<BR>&gt; lemmatising texts? For various reasons I need the texts I am examining to be<BR>&gt; in lemmatised form before analysis with corpus tools. It's a small<BR>&gt; collection of texts, a few hundred shortish (article -sized) ones in text<BR>&gt; format.<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; I've had some trouble with the software I'm using at the moment. It tends to<BR>&gt; 'stick' when given a formidable lemma list to process (I'm using Yasumasa<BR>&gt; Someya's fairly lengthy one).<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; All the best,<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt;<BR>&gt; Duncan Hunter<BR><BR></FONT></P></DIV></BODY></HTML>