I must confess, the idea that a corpus can be described in terms of &quot;parseability&quot; sounds a little ill-founded to me.&nbsp; The choice of particular parsing algorithm may dictate which examples are hard to process, as will the underlying grammar etc etc.&nbsp; <br>
<br>What would be interesting (read:&nbsp; hard) would be to look at the work on phase transitions in 3-sat problems and the like.&nbsp; So, are there underlying graph-related characteristics of parsing which make certain sentences intrinsically hard to process and in particular can these characteristics be framed in a manner that was independent of the actual parser.&nbsp;&nbsp; <br>
<br>Miles<br clear="all">
<br>-- <br>The University of Edinburgh is a charitable body, registered in Scotland, with registration number SC005336.