Index: conf/nutch-default.xml
===================================================================
--- conf/nutch-default.xml (revision 180032)
+++ conf/nutch-default.xml (working copy)
@@ -727,4 +727,38 @@
+
+
+
+ lang.ngram.min.length
+ 1
+ The minimum size of ngrams to uses to identify
+ language (must be between 1 and lang.ngram.max.length).
+ The larger is the range between lang.ngram.min.length and
+ lang.ngram.max.length, the better is the identification, but
+ the slowest it is.
+
+
+
+
+ lang.ngram.max.length
+ 4
+ The maximum size of ngrams to uses to identify
+ language (must be between lang.ngram.min.length and 4).
+ The larger is the range between lang.ngram.min.length and
+ lang.ngram.max.length, the better is the identification, but
+ the slowest it is.
+
+
+
+
+ lang.analyze.max.length
+ 0
+ The maximum bytes of data to uses to indentify
+ the language (0 means full content analysis).
+ The larger is this value, the better is the analysis, but the
+ slowest it is.
+
+
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/en.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/en.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/en.test (revision 0)
@@ -0,0 +1,105 @@
+Resumption of the session
+I declare resumed the session of the European Parliament adjourned on Friday 17 December 1999, and I would like once again to wish you a happy new year in the hope that you enjoyed a pleasant festive period.
+Although, as you will have seen, the dreaded 'millennium bug' failed to materialise, still the people in a number of countries suffered a series of natural disasters that truly were dreadful. You have requested a debate on this subject in the course of the next few days, during this part-session. In the meantime, I should like to observe a minute' s silence, as a number of Members have requested, on behalf of all the victims concerned, particularly those of the terrible storms, in the various countries of the European Union. Please rise, then, for this minute' s silence.
+(The House rose and observed a minute' s silence)
+
+Madam President, on a point of order. You will be aware from the press and television that there have been a number of bomb explosions and killings in Sri Lanka. One of the people assassinated very recently in Sri Lanka was Mr Kumar Ponnambalam, who had visited the European Parliament just a few months ago. Would it be appropriate for you, Madam President, to write a letter to the Sri Lankan President expressing Parliament's regret at his and the other violent deaths in Sri Lanka and urging her to do everything she possibly can to seek a peaceful reconciliation to a very difficult situation?
+
+Yes, Mr Evans, I feel an initiative of the type you have just suggested would be entirely appropriate. If the House agrees, I shall do as Mr Evans has suggested.
+
+Madam President, on a point of order. I would like your advice about Rule 143 concerning inadmissibility. My question relates to something that will come up on Thursday and which I will then raise again.
+The Cunha report on multiannual guidance programmes comes before Parliament on Thursday and contains a proposal in paragraph 6 that a form of quota penalties should be introduced for countries which fail to meet their fleet reduction targets annually. It says that this should be done despite the principle of relative stability. I believe that the principle of relative stability is a fundamental legal principle of the common fisheries policy and a proposal to subvert it would be legally inadmissible. I want to know whether one can raise an objection of that kind to what is merely a report, not a legislative proposal, and whether that is something I can competently do on Thursday.
+
+That is precisely the time when you may, if you wish, raise this question, i.e. on Thursday prior to the start of the presentation of the report.
+
+Madam President, coinciding with this year' s first part-session of the European Parliament, a date has been set, unfortunately for next Thursday, in Texas in America, for the execution of a young 34 year-old man who has been sentenced to death. We shall call him Mr Hicks.
+At the request of a French Member, Mr Zimeray, a petition has already been presented, which many people signed, including myself. However, I would ask you, in accordance with the line which is now constantly followed by the European Parliament and by the whole of the European Community, to make representations, using the weight of your prestigious office and the institution you represent, to the President and to the Governor of Texas, Mr Bush, who has the power to order a stay of execution and to reprieve the condemned person.
+This is all in accordance with the principles that we have always upheld.
+
+Thank you, Mr Segni, I shall do so gladly. Indeed, it is quite in keeping with the positions this House has always adopted.
+
+Madam President, I should like to draw your attention to a case in which this Parliament has consistently shown an interest. It is the case of Alexander Nikitin. All of us here are pleased that the courts have acquitted him and made it clear that in Russia, too, access to environmental information is a constitutional right. Now, however, he is to go before the courts once more because the public prosecutor is appealing. We know, and we have stated as much in very many resolutions indeed, including specifically during the last plenary part-session of last year, that this is not solely a legal case and that it is wrong for Alexander Nikitin to be accused of criminal activity and treason because of our involvement as the beneficiaries of his findings. These findings form the basis of the European programmes to protect the Barents Sea, and that is why I would ask you to examine a draft letter setting out the most important facts and to make Parliament's position, as expressed in the resolutions which it has adopted, clear as far as Russia is concerned.
+
+Yes, Mrs Schroedter, I shall be pleased to look into the facts of this case when I have received your letter.
+
+Madam President, I would firstly like to compliment you on the fact that you have kept your word and that, during this first part-session of the new year, the number of television channels in our offices has indeed increased considerably. But, Madam President, my personal request has not been met. Although there are now two Finnish channels and one Portuguese one, there is still no Dutch channel, which is what I had requested because Dutch people here like to be able to follow the news too when we are sent to this place of exile every month. I would therefore once more ask you to ensure that we get a Dutch channel as well.
+
+Mrs Plooij-van Gorsel, I can tell you that this matter is on the agenda for the Quaestors' meeting on Wednesday. It will, I hope, be examined in a positive light.
+
+Madam President, can you tell me why this Parliament does not adhere to the health and safety legislation that it actually passes? Why has no air quality test been done on this particular building since we were elected? Why has there been no Health and Safety Committee meeting since 1998? Why has there been no fire drill, either in the Brussels Parliament buildings or the Strasbourg Parliament buildings? Why are there no fire instructions? Why have the staircases not been improved since my accident? Why are no-smoking areas not enforced? It seems absolutely disgraceful that we pass legislation and do not adhere to it ourselves.
+
+Mrs Lynne, you are quite right and I shall check whether this has actually not been done. I shall also refer the matter to the College of Quaestors, and I am certain that they will be keen to ensure that we comply with the regulations we ourselves vote on.
+
+Madam President, Mrs Díez González and I had tabled questions on certain opinions of the Vice-President, Mrs de Palacio, which appeared in a Spanish newspaper. The competent services have not included them in the agenda on the grounds that they had been answered in a previous part-session.
+I would ask that they reconsider, since this is not the case. The questions answered previously referred to Mrs de Palacio' s intervention, on another occasion, and not to these comments which appeared in the ABC newspaper on 18 November.
+
+Mr Berenguer Fuster, we shall check all this. I admit that, at present, the matter seems to be somewhat confused. We shall therefore look into it properly to ensure that everything is as it should be.
+
+Madam President, I should like to know if there will be a clear message going out from Parliament this week about our discontent over today's decision refusing to renew the arms embargo on Indonesia, considering that the vast majority in this Parliament have endorsed the arms embargo in Indonesia in the past? Today's decision not to renew the embargo is extremely dangerous considering the situation there. So Parliament should send a message, since that is the wish of the vast majority. It is irresponsible of EU Member States to refuse to renew the embargo. As people have said, the situation there is extremely volatile. There is, in fact, a risk of a military coup in the future. We do not know what is happening. So why should EU arms producers profit at the expense of innocent people?
+
+In any event, this question is not presently included among the requests for topical and urgent debate on Thursday.
+
+Agenda
+The next item is the verification of the final version of the draft agenda as drawn up by the Conference of Presidents at its meeting of 13 January pursuant to Rule 110 of the Rules of Procedure. No amendments have been proposed relating to Monday and Tuesday.
+Relating to Wednesday:
+The Group of the Party of European Socialists requests that a Commission statement be included on its strategic objectives for the next five years and on the administrative reform of the Commission.
+I would like Mr Barón Crespo, who made the request, to speak to propose it. That is, if he so wishes, of course. Then we shall follow the usual procedure, hearing one speaker in favour and one against.
+
+Madam President, the presentation of the Prodi Commission' s political programme for the whole legislature was initially a proposal by the Group of the Party of European Socialists which was unanimously approved by the Conference of Presidents in September and which was also explicitly accepted by President Prodi, who reiterated his commitment in his inaugural speech.
+This commitment is important because the Commission is a body with a monopoly of initiative in accordance with the Treaties and, therefore, basically dictates this Parliament' s political and legislative activity for the next five years. I would also like to point out, Madam President, that this Parliament voted to express its confidence in President Prodi during the previous legislature. It did so again during this legislature, in July, and then, in September, it voted once more to approve the whole Commission. There has therefore been enough time for the Commission to prepare its programme and for us to become familiar with it and explain it to our citizens. To this end, I would like to remind you of the resolution of 15 September, which recommended that the proposal be presented as soon as possible.
+The events of last week - which originated outside the Conference of Presidents, that Conference being used simply to corroborate and ratify decisions taken elsewhere - present us with a dilemma. Either the Commission is not ready to present this programme, in which case it should clarify it. According to its President, it is in a position to do so. Given that the Commission is represented by Vice-President de Palacio, I believe that, before voting, it would help if the Commission could let us know how ready it is to present this programme, as agreed. Alternatively, Parliament is not ready to examine this programme, as some appear to be suggesting. In my opinion, this second hypothesis would imply the failure of Parliament in its duty as a Parliament, as well as introducing an original thesis, an unknown method which consists of making political groups aware, in writing, of a speech concerning the Commission' s programme a week earlier - and not a day earlier, as had been agreed - bearing in mind that the legislative programme will be discussed in February, so we could forego the debate, since on the next day our citizens will hear about it in the press and on the Internet and Parliament will no longer have to worry about it.
+My Group believes that since a parliament is meant to listen, debate and reflect, there can be no justification whatsoever for this delay and we believe that, if the Commission is ready to do so, we still have time to re-establish the original agreement between Parliament and the Commission and proceed in a manner which fulfils our duty to our fellow citizens. Therefore, the proposal of the Group of the Party of European Socialists, and which you have mentioned, is that the Prodi Commission present its legislative programme on Wednesday, including its proposed administrative reform, because, otherwise, we could find ourselves in a paradoxical situation: on the pretext that there is no text, on the one hand, the President of the Commission would be denied his right to speak in this Parliament and, on the other hand, there would be a debate on a reform when Parliament had no prior knowledge of the texts on which it is based. Therefore, Madam President, I would ask you to request that the Commission express its opinion on this issue and that we then proceed to the vote.
+(Applause from the PSE Group)
+
+Madam President, I really am quite astonished at Mr Barón Crespo' s behaviour and the fact that he is now asking for this item to be put on Wednesday's agenda.
+Mr Barón Crespo, you were unable to attend the Conference of Presidents last Thursday. I am not criticising this; it happens from time to time that people send someone to represent them. Mr Hänsch represented you on this occasion. In the Conference of Presidents, we had an in-depth discussion. Your Group was alone in advocating what you are saying now. We then put it to a vote. As you know, each chairman has the same number of votes as his Group has Members. There was a vote on this matter. As I recall, the outcome of this vote was 422 votes to 180 with a few abstentions. This means that all the Groups with the exception of the non-attached Members - but, of course, they are not a Group - were in agreement; only your Group thought that we should proceed as you have proposed here. All of the others were of a different opinion. That was the decision.
+I should now like to comment on the issue itself. We have confidence in the Commission and in Romano Prodi and, after a difficult procedure, as everyone knows, the vast majority of our Group supported the vote of confidence in Romano Prodi and the Commission. We believe, however, that the Commission's strategic plan needs to be debated within a proper procedural framework, not only on the basis of an oral statement here in the European Parliament, but also on the basis of a document which is adopted in the Commission and which describes this programme over the five-year period. There is no such document!
+
+The Commission will present its programme for the year 2000 in February. We have said, very well, if the Commission does not wish to introduce the 2000 programme as early as January then we will do it in February. We have agreed to this. After all, we do not wish to quarrel with the Commission; if at all possible, we believe that the Commission and Parliament need to tread the same path. However, we in Parliament also have a supervisory role with regard to the Commission and we do not have to agree with everything which comes out of the Commission.
+I should like us to be able to do a reasonable amount of preparation for the debate on the five-year programme in our Groups. You cannot prepare if you hear a statement in this House and have no idea of its content. That is why we would recommend - and it is my impression that the Commission is also open to this idea - that we hold the debate on the Commission's long-term programme up to the year 2005 in February - and I hope that the Commission will agree on a programme before then which it will propose to us - and that, at the same time, in February we also hold the debate on the Commission's legislative programme for the year 2000. The fact that the subjects are connected also suggests that we should hold the debate on both programmes together. That is why my Group firmly rejects the proposal made by the Socialist Group.
+(Applause from the PPE-DE Group)
+
+Madam President, I would like to make it very clear that, above all, the Commission has absolute respect for the decisions of this Parliament and, amongst those, the decision establishing its agenda. We therefore respect whatever Parliament may decide.
+But I would also like to make it very clear that President Prodi made a commitment to this Parliament to introduce a new debate, as Mr Barón Crespo has reminded us, which would be in addition to the annual debate on the Commission' s legislative programme, on the broad areas of action for the next five years, that is to say, for this legislature.
+Madam President, I would like to say that the agreement reached in September distinguished this debate from the annual presentation of the Commission' s legislative programme. I would also like to say that the Commission is prepared and ready to hold this debate whenever it is convenient and that we were ready to do so this week as we had agreed originally, on the basis that it would be presented the day before in a speech to parliamentary groups.
+Therefore, Madam President, I would like to repeat that the Commission has debated the action plan for the next five years and, when Parliament decides, - this week if that is the decision - we are prepared to come and explain the programme for the next five years and, next month, the programme for 2000, which is what we fully agreed upon.
+
+I propose that we vote on the request of the Group of the Party of European Socialists that the Commission statement on its strategic objectives should be reinstated.
+(Parliament rejected the request) President. Still on the subject of Wednesday' s sitting, I have another proposal regarding the oral question on capital tax. The PPE-DE Group is requesting that this item be taken off the agenda.
+Is there a member who wishes to speak on behalf of this Group to propose this?
+
+Madam President, I can hear a ripple of laughter from the Socialists. I was told that large sections of the Socialist Group were also keen to have this item taken off the agenda, because at the vote in the Conference of Presidents no vote was received from the working group of Members of the Socialist Group responsible for this matter. I do not know whether this information is correct, but the PPE-DE Group would, in any case, be grateful if this item were removed because Parliament has addressed this issue several times already. Decisions have also been adopted against a tax of this kind. That is why my Group moves that this item be taken off the agenda.
+
+Thank you, Mr Poettering.
+We shall now hear Mr Wurtz speaking against this request.
+
+Madam President, I would firstly like to point out Mr Poettering' s lack of logic. He has just been preaching to the Group of the Party of European Socialists because they went back on a decision taken in a perfectly clear manner at the Conference of Presidents, and now he is doing just the same. We discussed that matter and we were unanimous, with the exception of the PPE and ELDR Groups. As my fellow chairmen will recall, I even mentioned that it was not a matter of knowing whether one was for or against the Tobin tax, but of whether one dared to hear what the Commission and the Council thought of it. It is not a lot to ask. I therefore repeat the proposal that this oral question to the Commission and the Council should be retained so that we can find out, once and for all, the positions of these two bodies regarding the proposal which is relatively modest but which would give a clear message to public opinion, particularly after the tide of feeling generated by the failure of the Seattle Conference.
+
+We shall proceed to vote on the PPE-DE Group' s request that the oral question regarding the capital tax be withdrawn from the agenda.
+(Parliament rejected the request, with 164 votes for, 166 votes against and 7 abstentions)
+
+Madam President, I would like to thank Mr Poettering for advertising this debate. Thank you very much.
+
+Madam President, has my vote been counted? I was unable to vote electronically, since I do not have a card. My vote was "in favour" .
+
+Indeed, if we add the two Members who have declared themselves, then the result of the vote would be ....
+
+Madam President, the Presidency has already declared the result of the vote. There is no room for amendments.
+
+Ladies and gentlemen, once again, we see it is essential for Members to bring their voting cards along on a Monday. Clearly there is a problem here. That being the case, I shall have to make a decision.
+I too forgot my card, and I would have voted against. I therefore consider that the oral question may be kept on the agenda as per the vote.
+This is the last time that we shall make allowances for Members who have forgotten their cards. Let that be clearly noted and understood.
+(Applause)The oral question will therefore remain on the agenda, and yes, your President is entitled to vote just as she is entitled to forget her voting card.
+We shall continue with the other amendments to the agenda.
+
+Madam President, in the earlier vote - and I will abide by your ruling on this matter - on the question of the strategic plan of the Commission I indicated that I would like to speak in advance of the vote on behalf of my Group. That did not happen. I would appreciate it if, on the close of this item of business, I might be allowed to give an explanation of vote on behalf of my Group. This is an important matter. It would be useful for the record of the House to state how people perceive what we have just done in the light of their own political analysis.
+
+Madam President, I do not wish to reopen the debate, but I had also asked for the floor, to comment on Mr Barón Crespo's motion. You did not call me either. I regret this, but the vote has already been taken and the decision is made so let us leave the matter there.
+
+I am terribly sorry, Mr Hänsch and Mr Cox. I did not see you asking to speak. Even so, I think the positions are quite clear and they shall be entered in the Minutes. When we adopt the Minutes for today' s sitting tomorrow, then any Members who think the positions have not been explained clearly enough may ask for amendments. This seems to me to be a workable solution. Of course, the Minutes for tomorrow' s sitting will take into account any additional explanations. I think this is a better solution than proceeding now to extremely time-consuming explanations of votes. Mr Cox, Mr Hänsch, would this be acceptable to you?
+
+Madam President, if the vote records correctly how my Group voted I shall not, and cannot, object to that. If your ruling is that I cannot give an explanation of vote, I accept that but with reservations.
+
+We shall pay particular attention to the wording of the Minutes, as we always do, of course. If they do not properly reflect the positions adopted, then we may correct them, if necessary.
+(The order of business was adopted thus amended)
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/fr.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/fr.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/fr.test (revision 0)
@@ -0,0 +1,105 @@
+Reprise de la session
+Je déclare reprise la session du Parlement européen qui avait été interrompue le vendredi 17 décembre dernier et je vous renouvelle tous mes vux en espérant que vous avez passé de bonnes vacances.
+Comme vous avez pu le constater, le grand "bogue de l'an 2000" ne s'est pas produit. En revanche, les citoyens d'un certain nombre de nos pays ont été victimes de catastrophes naturelles qui ont vraiment été terribles. Vous avez souhaité un débat à ce sujet dans les prochains jours, au cours de cette période de session. En attendant, je souhaiterais, comme un certain nombre de collègues me l'ont demandé, que nous observions une minute de silence pour toutes les victimes, des tempêtes notamment, dans les différents pays de l'Union européenne qui ont été touchés. Je vous invite à vous lever pour cette minute de silence.
+(Le Parlement, debout, observe une minute de silence)
+
+Madame la Présidente, c'est une motion de procédure. Vous avez probablement appris par la presse et par la télévision que plusieurs attentats à la bombe et crimes ont été perpétrés au Sri Lanka. L'une des personnes qui vient d'être assassinée au Sri Lanka est M. Kumar Ponnambalam, qui avait rendu visite au Parlement européen il y a quelques mois à peine. Ne pensez-vous pas, Madame la Présidente, qu'il conviendrait d'écrire une lettre au président du Sri Lanka pour lui communiquer que le Parlement déplore les morts violentes, dont celle de M. Ponnambalam, et pour l'inviter instamment à faire tout ce qui est en son pouvoir pour chercher une réconciliation pacifique et mettre un terme à cette situation particulièrement difficile.
+
+Oui, Monsieur Evans, je pense qu'une initiative dans le sens que vous venez de suggérer serait tout à fait appropriée. Si l'Assemblée en est d'accord, je ferai comme M. Evans l'a suggéré.
+
+Madame la Présidente, c'est une motion de procédure. Je voudrais vous demander un conseil au sujet de l'article 143, qui concerne l'irrecevabilité. Ma question porte sur un sujet qui est à l'ordre du jour du jeudi et que je soulèverai donc une nouvelle fois.
+Le paragraphe 6 du rapport Cunha sur les programmes d'orientation pluriannuels, qui sera soumis au Parlement ce jeudi, propose d'introduire des sanctions applicables aux pays qui ne respectent pas les objectifs annuels de réduction de leur flotte. Il précise que cela devrait être fait malgré le principe de stabilité relative. À mon sens, le principe de stabilité relative est un principe juridique fondamental de la politique commune de la pêche et toute proposition le bouleversant serait juridiquement irrecevable. Je voudrais savoir si l'on peut avancer une objection de ce type à ce qui n'est qu'un rapport, pas une proposition législative, et si je suis habilité à le faire ce jeudi.
+
+C'est exactement à ce moment-là que vous pourrez, en effet, si vous le souhaitez, soulever cette question, c'est-à-dire jeudi avant le début de la présentation du rapport.
+
+Madame la Présidente, alors que se déroule la première session de l'année du Parlement européen, l'exécution d'un condamné à mort au Texas aux États-Unis, un jeune homme de 34 ans appelé Hicks, a été fixée, malheureusement, à jeudi prochain.
+À la demande d'un député français, Monsieur Zimeray, une pétition a déjà été introduite ; elle a récolté de nombreuses signatures dont la mienne. Cependant, je vous demande, conformément à l'orientation désormais constamment exprimée par le Parlement européen et toute la Communauté européenne, d'intervenir auprès du président et du gouverneur du Texas, Monsieur Bush, en faisant jouer le prestige de votre mandat et de l'Institution que vous représentez, car c'est Monsieur Bush qui a le pouvoir de suspendre la condamnation à mort et de gracier le condamné.
+Et tout ceci dans le respect des principes que nous avons toujours soutenus.
+
+Merci, Monsieur Segni, je le ferai bien volontiers. C'est en effet tout à fait dans la ligne des positions que notre Parlement a toujours adoptées.
+
+Madame la Présidente, je voudrais attirer votre attention sur un cas dont s'est régulièrement occupé le Parlement. Il s'agit du cas d'Alexandre Nikitin. Nous nous réjouissons tous, dans cette enceinte, que le tribunal ait prononcé sa libération et ait clairement établi qu'en Russie aussi, l'accès aux informations environnementales était un droit constitutionnel. Cependant, il se fait qu'il semblerait être à nouveau mis en accusation, le ministère public ayant interjeté appel. Nous savons, et nous l'avons d'ailleurs établi dans de très nombreuses résolutions - y compris lors de la dernière période de session de l'année dernière -, que ce cas n'est pas seulement de nature juridique et qu'il est faux d'accuser Alexandre Nikitin d'activité criminelle et de trahison car nous sommes concernés par ses résultats et nous en profitons. Ces résultats forment la base des programmes européens de protection de la mer de Barents et c'est pourquoi je vous prie d'examiner un projet de lettre vous dépeignant les faits essentiels de cette affaire et de communiquer à la Russie la position qui découle des décisions du Parlement.
+
+Oui, Madame Schroedter, j'examinerai bien volontiers les faits relatifs à cette question lorsque j'aurai reçu votre lettre.
+
+Madame la Présidente, je voudrais tout d'abord vous féliciter pour avoir tenu parole car en effet, en cette première période de session, en cette nouvelle année, le nombre de chaînes de télévision a réellement été augmenté de manière significative dans nos locaux. Toutefois, Madame la Présidente, ce que j'avais demandé n'a pas été réalisé. Il y a bien deux chaînes finnoises et une chaîne portugaise, mais il n'y a toujours aucune chaîne néerlandaise. Pourtant je vous avais demandé une chaîne néerlandaise, car les Néerlandais aussi désirent pouvoir suivre les actualités chaque mois lorsqu'ils sont envoyés en cette terre d'exil. Je vous demande donc à nouveau de faire le nécessaire pour que nous puissions disposer d'une chaîne néerlandaise.
+
+Madame Plooij-van Gorsel, je peux vous dire que cette question est à l'ordre du jour de la réunion des questeurs de mercredi. Elle sera, je l'espère, examinée dans un esprit positif.
+
+Madame la Présidente, comment se fait-il que le Parlement ne se conforme pas à la réglementation en matière de santé et de sécurité qu'il vote ? Comment se fait-il qu'aucun test de qualité de l'air n'ait été réalisé dans ce bâtiment depuis notre élection ? Comment se fait-il que le comité de santé et d'hygiène ne se soit plus réuni depuis 1998 ? Comment se fait-il que nous n'ayons jamais fait d'exercice d'évacuation dans les bâtiments du Parlement de Bruxelles et de Strasbourg ? Comment se fait-il qu'il n'y ait pas de consignes en cas d'incendie ? Comment se fait-il que les escaliers n'aient pas été améliorés depuis mon accident ? Comment se fait-il que l'on ne respecte pas les zones non fumeurs ? Nous votons des réglementations et nous ne nous y conformons même pas. C'est scandaleux.
+
+Madame Lynne, vous avez parfaitement raison et je vais vérifier si tout cela n' a effectivement pas été fait. Je vais soumettre également le problème au Collège des questeurs et je suis certaine que nos questeurs auront à cur de faire en sorte que nous respections la réglementation qu' en effet nous votons.
+
+Madame la Présidente, Mme Díez González et moi-même avions présenté quelques questions sur certaines opinions exprimées par la vice-présidente, Mme de Palacio, et publiées dans un journal espagnol. Les services compétents ne les ont pas inclues à l'ordre du jour, avançant que des réponses avaient déjà été apportées lors d'une précédente session.
+Je demande que cette décision soit reconsidérée car ce n'est pas le cas. Les questions auxquelles on a répondu précédemment se rapportaient à l'intervention de Mme de Palacio dans un dossier précis, et non aux déclarations parues dans le journal ABC du 18 novembre dernier.
+
+ Cher collègue nous allons vérifier tout cela. Je vous avouerai que, pour le moment, les choses me semblent un petit peu confuses. Donc, nous allons revoir cela très sérieusement pour que tout soit bien en ordre.
+
+Madame la Présidente, je voudrais savoir si cette semaine, le Parlement va envoyer un message clair exprimant son mécontentement quant à la décision prise aujourd'hui de refuser de renouveler l'embargo sur les armes à destination de l'Indonésie, alors que par le passé, le Parlement a souscrit à une très large majorité à l'embargo sur les armes à destination de l'Indonésie. La décision d'aujourd'hui de ne pas renouveler l'embargo est extrêmement dangereuse, compte tenu de la situation sur place. Le Parlement devrait dès lors envoyer un message en ce sens, étant donné qu'une grande majorité des députés le souhaite. En refusant de prolonger l'embargo, les États membres font preuve d'irresponsabilité. D'aucuns l'ont dit, la situation en Indonésie est extrêmement explosive. Il y a en réalité un risque de coup d'État. Nous ne savons pas ce qui se passe. Pourquoi donc les producteurs d'armes de l'UE devraient-ils s'enrichir sur le dos de personnes innocentes ?
+
+En tout cas, cette question ne figure pas pour l' instant parmi les demandes d' urgence pour jeudi prochain.
+
+Ordre des travaux
+L' ordre du jour appelle l' examen du projet définitif d' ordre du jour tel qu' il a été établi par la Conférence des présidents, le jeudi 13 janvier, conformément à l' article 110 du règlement. S' agissant de lundi et mardi, je n' ai pas de modifications.
+En ce qui concerne le mercredi :
+Le groupe socialiste demande d' inclure une déclaration de la Commission sur ses objectifs stratégiques pour les cinq ans à venir, ainsi que sur la réforme administrative de la Commission.
+Je souhaiterais que M. Barón Crespo, auteur de la demande, intervienne pour la justifier, s' il le souhaite bien sûr. Puis , nous ferons comme d' habitude : nous entendrons un orateur pour et un orateur contre.
+
+Madame la Présidente, la présentation du programme politique de la Commission Prodi pour l'ensemble de la législature était au départ une proposition du groupe du parti des socialistes européens qui a obtenu l'unanimité lors de la Conférence des présidents en septembre, mais aussi l'approbation explicite du président Prodi, qui a réitéré son engagement dans son discours d'investiture.
+Cet engagement est important dans la mesure où la Commission est un organisme qui détient, conformément aux Traités, le monopole de l'initiative et qui, par conséquent, décide pour l'essentiel quelle sera l'activité politique et législative de ce Parlement au cours des cinq prochaines années. Je vous rappelle en outre, Madame la Présidente, que ce Parlement a voté par deux fois la confiance au président Prodi lors de la précédente législature ; au cours de cette législature, il l'a de nouveau votée en juillet et, ensuite, avec l'entrée en fonction de la nouvelle Commission, il a redonné sa confiance en septembre à l'ensemble de la Commission. Il s'est donc écoulé suffisamment de temps pour que la Commission prépare son programme et pour que nous puissions en prendre connaissance et l'expliquer aux citoyens. En ce sens, je vous rappelle la résolution du 15 septembre, laquelle recommandait que la proposition soit présentée dans les plus brefs délais.
+Les événements qui se sont produits la semaine dernière qui sont nés en marge de la Conférence des présidents et se servent d'elle dans le seul but de corroborer et de ratifier des décisions prises en dehors de celle-ci créent un dilemme : ou bien la Commission n'est pas en mesure de présenter ce programme ; (dans ce cas, il conviendrait qu'elle tire les choses au clair. Aux dires de son Président, la Commission serait en mesure de le faire. Étant donné que la Commission est représentée par la vice-présidente, Mme de Palacio, je crois qu'avant de voter, il serait bon de connaître la position de la Commission en ce qui concerne ses disponibilités pour présenter le programme, tel que cela avait été convenu) ou bien le Parlement n'est pas en mesure d'examiner ce programme, comme certains semblent le prétendre. À mon avis, cette deuxième hypothèse signifierait le rejet de nos responsabilités en tant que Parlement, outre l'introduction d'une thèse originale, d'une méthode inconnue qui consiste à communiquer aux groupes politiques le discours du programme de la Commission par écrit une semaine avant et non le jour avant, comme il avait été convenu , en tenant compte du fait que le programme législatif serait discuté en février, de telle sorte que nous pourrions nous passer du débat, car le lendemain, la presse et Internet l'auraient porté à la connaissance de tous les citoyens et le Parlement n'aurait plus de raison de s'en occuper.
+Mon groupe estimant qu'un Parlement est là pour écouter, pour débattre et pour réfléchir, nous pensons qu'aucune raison ne justifie cet ajournement et nous croyons que si la Commission est en mesure de le présenter, nous avons parfaitement le temps pour rétablir l'accord original entre le Parlement et la Commission et d'agir de manière responsable vis-à-vis de nos concitoyennes et concitoyens. Par conséquent, la proposition du groupe du parti des socialistes européens que vous avez mentionnée est de maintenir à mercredi la présentation du programme de législature de la Commission Prodi, en incluant également dans le programme le projet de réforme administrative car, si ce n'est pas fait, nous risquons de nous retrouver dans une position paradoxale : sous prétexte qu'il n'y a pas de texte, on refuse d'une part le droit du président de la Commission à s'exprimer dans ce Parlement et, d'autre part, la tenue d'un débat sur une réforme dont le Parlement ne connaît pas les textes. Je vous prie dès lors, Madame la Présidente, de demander à la Commission de s'exprimer maintenant et que l'on procède ensuite au vote.
+(Applaudissements du groupe PSE)
+
+Madame la Présidente, chers collègues, je suis tout de même quelque peu surpris de l'attitude de notre collègue Barón Crespo qui demande à présent que ce point de l'ordre du jour soit placé à l'ordre du jour de la séance de mercredi.
+Monsieur Barón Crespo, vous n'avez pu être présent à la Conférence des présidents de jeudi dernier. Je ne le critique pas : il peut arriver qu'on se fasse représenter. M. Hänsch vous y a représenté. Nous avons mené un débat en profondeur au cours de cette Conférence des présidents. Seul votre groupe a défendu la position que vous venez d'exposer. Nous avons ensuite procédé à un vote, chaque président ou présidente disposant d'un nombre de voix égal au nombre de ses membres. Il y a donc eu un vote à ce stade de la réunion et, de ce que je me souviens, ce vote a donné le résultat suivant : 422 voix contre 180 et quelques rares abstentions. Ce qui signifie qu'à l'exception des non-inscrits - qui ne constituent cependant pas un groupe -, seul votre groupe était d'avis de procéder de la manière que vous venez de proposer. Tous les autres étaient d'un avis différent. Telle était la décision prise.
+À présent, je voudrais dire quelques mots sur l'affaire en tant que telle. Nous avons confiance en la Commission, en Romano Prodi, et, au terme d'un processus difficile connu de chacun, la toute grande majorité de notre groupe a témoigné sa confiance à Romano Prodi et à sa Commission. Mais nous pensons également devoir tenir un débat sur la stratégie de la Commission dans le cadre d'une procédure ordonnée, ne reposant pas seulement sur une déclaration orale faite au sein du Parlement européen mais sur un document adopté par la Commission et décrivant ce programme pour les cinq ans à venir. Un tel document n'existe pas.
+La Commission présentera le programme pour l'an 2000 en février. Nous avons marqué notre accord et dit que si la Commission ne présentait pas ce programme en janvier, nous le ferions en février. Nous avons marqué notre accord. Nous ne voulons pas d'un conflit avec la Commission et pensons que, dans la mesure du possible, la Commission et le Parlement doivent avancer de concert. Toutefois, le Parlement est également le contrôleur de la Commission. Et tout ce qui provient de la Commission ne doit pas avoir notre assentiment.
+Je voudrais que les groupes puissent procéder à la préparation judicieuse d'un débat sur ce programme pour les cinq ans à venir. On ne peut s'y préparer si l'on entend une déclaration dans cette enceinte sans même connaître le contenu d'une telle déclaration. C'est pourquoi nous recommandons - et j'ai l'impression que la Commission se range également à cette idée - de mener le débat sur le programme de la Commission jusqu'à 2005 au cours du mois de février - j'espère que d'ici là, la Commission se sera accordée sur un programme qu'elle nous soumettra - et de mener au cours du même mois de février le débat sur le programme législatif de la Commission pour l'an 2000. La logique nous invite donc également à mener de concert les débats sur ces deux programmes. C'est pourquoi mon groupe rejette résolument la proposition du groupe socialiste.
+(Applaudissements du groupe PPE-DE)
+
+Madame la Présidente, avant toute chose, je voudrais qu'il soit bien clair que la Commission a le plus grand respect pour les décisions de ce Parlement et, notamment, pour celle qui concerne la fixation de l'ordre du jour. Par conséquent, nous respectons les décisions que pourrait prendre le Parlement dans ce sens.
+Mais je voudrais également qu'il soit bien clair que le président Prodi s'est engagé avec le Parlement à instaurer un nouveau débat, comme l'a rappelé M. Barón, qui vient s'ajouter au débat annuel sur le programme législatif de la Commission, sur les grandes lignes d'action pour la prochaine période de cinq ans, c'est-à-dire pour cette législature.
+Je voudrais dire, Madame la Présidente, que, dans l'accord auquel on est parvenu au mois de septembre, ce débat diffère de la présentation annuelle du programme législatif de la Commission. J'ajouterais, Madame la Présidente, que, du côté de la Commission, nous sommes prêts et disposés à organiser ce débat quand cela vous conviendra, que nous étions prêts à le développer cette semaine, comme cela avait été décidé au départ, en se basant sur le fait qu'il était présenté la veille dans un discours aux groupes parlementaires.
+Je voudrais donc répéter, Madame la Présidente, que, pour notre part, nous avons discuté du programme d'action pour les cinq prochaines années et que nous sommes prêts à venir présenter le programme pour les cinq prochaines années quand le Parlement le décidera y compris cette semaine, si telle est sa décision et le programme pour l'an 2000, le mois prochain, ce sur quoi nous nous étions parfaitement mis d'accord.
+
+Je propose que nous votions sur la demande du groupe socialiste visant à réinscrire la déclaration de la Commission sur ses objectifs stratégiques.
+(Le Parlement rejette la demande) La Présidente. Toujours au sujet de la journée du mercredi, j'ai une autre proposition concernant la question orale sur l'impôt sur le capital. Le groupe PPEDE demande de retirer ce point de l'ordre du jour.
+Y a-t-il un collègue pour prendre la parole au nom du groupe et justifier cette demande ?
+
+Madame la Présidente, pour répondre aux rires que j'entends parmi les socialistes, on m'a dit que de larges pans du groupe socialiste aimeraient également supprimer ce point de l'ordre du jour car lors du scrutin au sein de la Conférence des présidents, les collègues responsables du groupe socialiste ne disposaient pas du vote du groupe de travail. Je ne sais si cette information est correcte mais quoi qu'il en soit, le groupe PPE-DE vous saurait gré de supprimer ce point de l'ordre du jour car le Parlement s'est en effet maintes fois saisi de cette question. Des décisions existent qui s'opposent à une telle taxe. C'est pourquoi mon groupe demande que ce point soit retiré de l'ordre du jour.
+
+Merci Monsieur Poettering.
+Nous entendons à présent M. Wurtz, qui s' exprime contre cette demande.
+
+Madame la Présidente, je voudrais d' abord souligner le manque de logique de M. Poettering. A l' instant, il vient de faire la leçon au groupe socialiste parce que celui-ci revient sur une décision qui a été prise de façon extrêmement nette en Conférence des présidents. Or, il fait la même chose. Nous avons discuté, nous étions unanimes sauf le groupe PPE et le groupe libéral et j' avais même fait remarquer, vous vous en souviendrez mes chers confrères présidents, que la question n' est pas de savoir si vous êtes pour ou contre la taxe Tobin, mais de savoir si vous osez entendre ce que la Commission et le Conseil en pensent. Ce n' est pas demander beaucoup. Donc, je réitère la proposition de maintenir cette question orale à la Commission et au Conseil pour connaître une fois pour toutes la position de ces deux instances par rapport à cette proposition relativement modeste, mais qui donnerait un signal important à l' opinion, en particulier après l' émotion suscitée par l' échec de la conférence de Seattle.
+
+Nous allons voter sur la demande du groupe PPE-DE visant à retirer la question orale concernant l' impôt sur le capital de l' ordre du jour.
+(Le Parlement rejette la demande avec 164 voix pour, 166 voix contre et 7 abstentions)
+
+Madame la Présidente, je voudrais remercier M. Poettering pour le coup de publicité qu' il vient de donner à ce débat. Merci.
+
+Madame la Présidente, a-t-on comptabilisé mon vote, qui n'a pu être réalisé électroniquement parce que je n'ai pas ma carte ? J'ai voté "pour".
+
+Effectivement, si on ajoute les deux collègues qui se sont manifestés, nous obtenons comme résultat....
+
+Madame la Présidente, la présidence a proclamé le résultat du vote. Les modifications n'ont pas lieu d'être.
+
+Mes chers collègues, encore une fois, il faut que chacun ait bien sa carte le lundi. On voit que nous avons là un problème. Cela étant, je dois prendre une décision.
+J' ai aussi oublié ma carte et j' aurais voté contre. Je considère donc que la question orale reste maintenue à l' ordre du jour.
+C' est la dernière fois que nous tiendrons compte des cartes oubliées. Que ceci soit bien clair et qu' on se le dise.
+(Applaudissements)
+Oui, la question orale est maintenue à l' ordre du jour et oui, la présidente a le droit de voter, comme elle a aussi le droit d' oublier sa carte.
+Nous poursuivons avec les autres modifications de l' ordre du jour.
+
+Madame la Présidente, lors du dernier vote et je m'en remets à votre décision sur ce sujet - sur la question du plan stratégique de la Commission, j'ai signalé que je demandais la parole avant le vote au nom de mon groupe. Mais ma demande n'a pas été satisfaite. Je vous saurai gré, à l'issue de ce point de l'ordre du jour, de me permettre de fournir un explication de vote au nom de mon groupe. C'est important. Il serait utile de consigner au procès-verbal du Parlement la manière dont les gens perçoivent ce que nous venons de faire, à la lumière de leur propre analyse politique.
+
+Madame la Présidente, je ne veux pas relancer le débat mais j'avais également demandé la parole pour m'exprimer quant à la demande de M. Barón Crespo. Moi non plus, vous ne m'avez pas donné la parole. Je le déplore mais le vote a été effectué, la décision est tombée et nous devrions donc en rester là.
+
+Je suis désolée, Monsieur Hänsch et Monsieur Cox, je n'avais pas vu que vous demandiez la parole. Cela étant, je crois que les positions sont bien claires et elles seront consignées au procès-verbal. Lorsque nous adopterons demain le procès-verbal de la séance d'aujourd'hui, les collègues qui estimeront que les positions n'ont pas été suffisamment bien expliquées pourront demander des modifications. Il me semble que c'est une bonne formule. Bien entendu, le procès-verbal de la réunion de demain tiendra compte de toutes les explications complémentaires. Je crois que c'est une meilleure formule que de procéder maintenant à des explications de vote qui nous entraîneraient très loin. Monsieur Cox, Monsieur Hänsch, est-ce que cela vous convient ?
+
+Madame la Présidente, si le procès-verbal reflète correctement le vote de mon groupe, je n'ai et n'aurai aucune objection à formuler. Si votre décision est que je ne puis pas donner d'explication de vote, je l'accepte, mais avec certaines réserves.
+
+Nous ferons donc très attention à la rédaction du procès-verbal. Nous le faisons d'ailleurs toujours. S'il ne reflète pas bien les positions, nous pourrons éventuellement le corriger.
+(Le Parlement adopte l'ordre des travaux ainsi modifié)
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/es.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/es.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/es.test (revision 0)
@@ -0,0 +1,107 @@
+Reanudación del período de sesiones
+Declaro reanudado el período de sesiones del Parlamento Europeo, interrumpido el viernes 17 de diciembre pasado, y reitero a Sus Señorías mi deseo de que hayan tenido unas buenas vacaciones.
+Como todos han podido comprobar, el gran "efecto del año 2000" no se ha producido. En cambio, los ciudadanos de varios de nuestros países han sido víctimas de catástrofes naturales verdaderamente terribles. Sus Señorías han solicitado un debate sobre el tema para los próximos días, en el curso de este período de sesiones. A la espera de que se produzca, de acuerdo con muchos colegas que me lo han pedido, pido que hagamos un minuto de silencio en memoria de todas las víctimas de las tormentas, en los distintos países de la Unión Europea afectados. Invito a todos a que nos pongamos de pie para guardar un minuto de silencio.
+(El Parlamento, de pie, guarda un minuto de silencio)
+
+Señora Presidenta, una cuestión de procedimiento. Sabrá usted por la prensa y la televisión que se han producido una serie de explosiones y asesinatos en Sri Lanka. Una de las personas que recientemente han asesinado en Sri Lanka ha sido al Sr. Kumar Ponnambalam, quien hace pocos meses visitó el Parlamento Europeo. ¿Sería apropiado que usted, Señora Presidenta, escribiese una carta al Presidente de Sri Lanka expresando las condolencias del Parlamento por esa y otras muertes violentas, pidiéndole que haga todo lo posible para encontrar una reconciliación pacífica ante la extremadamente difícil situación que está viviendo su país?
+
+Sí, señor Evans, pienso que una iniciativa como la que usted acaba de sugerir sería muy adecuada. Si la Asamblea está de acuerdo, haré lo que el señor Evans acaba de sugerir.
+
+ Señora Presidenta, una cuestión de procedimiento. Me gustaría que me asesorara sobre el Artículo 143 concerniente a la inadmisibilidad. Mi pregunta se refiere a un asunto del que se hablará el jueves, día que en volveré a plantearla.
+El informe Cunha sobre los programas de dirección plurianual se presenta al Parlamento el jueves y contiene una propuesta en el apartado 6 en torno a una forma de penalizaciones basada en cuotas que debe aplicarse a los países que no cumplan anualmente sus objetivos de reducción de flota. El informe estipula que se debe aplicarse a pesar del principio de estabilidad relativa. Creo que el principio de estabilidad relativa es un principio legal fundamental de las políticas pesqueras comunitarias, por lo que una propuesta que lo subvierta es legalmente inadmisible. Quiero saber si se puede hacer este tipo de objeción a lo que sólo es un informe, no una propuesta legislativa, y si es algo que puedo plantear el jueves.
+
+Su Señoría, si así lo desea, podrá plantear esta cuestión en ese momento, es decir, el jueves antes de que se presente el informe.
+
+Señora Presidenta, coincidiendo con el primer período parcial de sesiones de este año del Parlamento Europeo, lamentablemente, en los Estados Unidos, en Texas, se ha fijado para el próximo jueves la ejecución de un condenado a la pena capital, un joven de 34 años que llamaremos con el nombre de Hicks.
+A petición de un diputado francés, el Sr. Zimeray, se ha presentado una solicitud, cuyos firmantes han sido numerosos y entre los cuales me cuento, sin embargo, de conformidad con la posición constantemente expresada por el Parlamento Europeo y por toda la Comunidad europea, le pido que intervenga con el prestigio de su cargo y de la Institución que representa ante el Presidente y el Gobernador del Estado de Texas, Sr. Bush, que tiene la facultad de suspender la condena a muerte y de indultar al condenado.
+Todo ello, de conformidad con los principios que siempre hemos apoyado.
+
+Gracias, señor Segni, lo haré de muy buen grado. Está, sin duda, dentro de la línea de las posiciones que nuestro Parlamento siempre ha adoptado.
+
+Señora Presidenta, quisiera llamar la atención de usted acerca de un caso del que se ha ocupado una y otra vez este Parlamento. Es el caso de Alexander Nikitin. Todos celebramos aquí que el tribunal le haya declarado inocente y que haya puesto de manifiesto que también en Rusia el acceso a la información sobre el medio ambiente es un derecho constitucional. Sin embargo, sucede que va a ser acusado de nuevo, pues el fiscal interpondrá un recurso. Sabemos y lo hemos afirmado realmente en muchas resoluciones -precisamente en la última sesión plenaria del año pasado- que éste no es solamente un caso jurídico y que es un error acusar a Alexander Nikitin de conducta criminal y de traición, porque nosotros, como afectados por sus resultados, obtengamos provecho de ella. Esos resultados constituyen la base de los programas europeos del mar de Barent y, por ello, le pido que estudie un borrador de carta que le describe los hechos más relevantes y que haga patente a Rusia esta posición que es acorde con las decisiones del Parlamento.
+
+Sí, señora Schroedter, de buena gana voy a examinar los hechos relacionados con este tema en cuanto reciba su carta.
+
+Señora Presidenta, en primer lugar me gustaría felicitarla por haber cumplido con su promesa ya que efectivamente en este primer periodo de sesiones del año nuevo se ha ampliado drásticamente el número de canales en nuestros despachos. Sin embargo, señora Presidenta, no se ha hecho lo que yo había pedido. Bien es verdad que ahora hay dos canales finlandeses y uno portugués, pero aún no hay ninguno neerlandés y yo le había pedido un canal neerlandés, porque también los neerlandeses quisiéramos escuchar las noticias cada mes, cuando nos mandan a este exilio. Por lo tanto quisiera pedirle nuevamente que se encargue de que podamos ver también un canal neerlandés.
+
+Señora Plooij-van Gorsel, puedo decirle que esa cuestión está en el orden del día de la reunión de cuestores fijada para el miércoles. Espero que se examine con un espíritu positivo.
+
+Señora Presidenta, ¿podría decirme por qué este Parlamento no cumple la legislación de sanidad y seguridad que en realidad ha aprobado? ¿Por qué no se ha hecho ninguna prueba de calidad del aire de este edificio desde que hemos sido elegidos? ¿Por qué no se ha celebrado ninguna reunión del Comité de Sanidad y Seguridad desde 1998? ¿Por qué no hemos tenido simulacros de incendio ni en los edificios del Parlamento de Bruselas ni en los del Parlamento de Estrasburgo? ¿Por qué no hay instrucciones en caso de incendio? ¿Por qué no se han mejorado las escaleras desde mi accidente? ¿Por qué no se respetan las áreas de no fumadores? Es totalmente vergonzoso que aprobemos una legislación y no la cumplamos ni nosotros mismos.
+
+Señora Lynne, tiene toda la razón del mundo, y verificaré si estas cosas no se han hecho de verdad. También someteré el problema a la Junta de Cuestores, y estoy segura de que los cuestores harán lo debido para que respetemos las normas que, efectivamente, nosotros mismos votamos.
+
+Sra. Presidenta, la Sra. Díez González y yo mismo habíamos presentado unas preguntas sobre determinadas opiniones, reproducidas en un diario español, de la Vicepresidenta, Sra. de Palacio. Los servicios competentes no las han incluido en el orden del día por considerar que ya habían sido contestadas en una sesión anterior.
+Ruego que se reconsidere esta decisión porque esto no es así. Las preguntas contestadas con anterioridad se referían a la intervención, en determinado expediente, de la Sra. de Palacio, no a esas declaraciones aparecidas en el diario ABC el 18 de noviembre pasado.
+
+Señoría, vamos a verificar todo esto. Le confieso que, de momento, las cosas me parecen un tanto confusas. Por consiguiente, vamos a revisarlas con seriedad para que todo esté en orden.
+
+Señora Presidenta, me gustaría saber si el Parlamento emitirá esta semana un comunicado claro sobre el descontento por la decisión de hoy de no renovar el embargo de armas a Indonesia, considerando que la inmensa mayoría de este Parlamento apoyó en el pasado el embargo de armas a Indonesia. La decisión de hoy de no renovar el embargo es extremadamente peligrosa teniendo en cuenta la situación de ese país. Por lo tanto, el Parlamento debe enviar un mensaje, ya que ése es el deseo de la inmensa mayoría. Es irresponsable por parte de los Estados Miembros de la UE negarse a renovar el embargo. Como ha dicho la gente, la situación allí es extremadamente precaria. De hecho, existe el riesgo de un golpe militar en el futuro. No sabemos lo que está ocurriendo allí. ¿Por qué tienen que beneficiarse los productores de armas de la UE a expensas de gente inocente?
+
+En cualquier caso, este tema no figura ahora mismo entre las demandas de urgencia para el jueves próximo.
+
+Orden de los trabajos
+De conformidad con el orden del día, se procede a examinar el proyecto definitivo de orden del día, establecido de conformidad con el artículo 110 del Reglamento en la Conferencia de Presidentes, el jueves 13 de enero. En lo relativo al lunes y al martes, no hay modificaciones.
+Miércoles :
+El Grupo del Partido de los Socialistas Europeos solicita que se incluya una declaración de la Comisión sobre sus objetivos estratégicos para los próximos cinco años, así como sobre la reforma administrativa de la Comisión.
+Desearía que el Sr. Barón Crespo, autor de la petición, interviniera para justificarla, si a él le parece adecuado, por supuesto. Como siempre, escucharemos a un orador a favor y a otro en contra.
+
+Señora Presidenta, la presentación del programa político de la Comisión Prodi para toda la legislatura fue inicialmente una propuesta del Grupo del Partido de los Socialistas Europeos que logró la unanimidad de la Conferencia de Presidentes en septiembre y también la aceptación explícita del Presidente Prodi, que reiteró su compromiso en su discurso de investidura.
+Tiene importancia este compromiso en la medida en que la Comisión es un organismo que tiene el monopolio de la iniciativa de acuerdo con los Tratados y, por lo tanto, configura básicamente lo que va a ser la actividad política y legislativa de este Parlamento en los próximos cincos años. Recuerdo además, señora Presidenta, que este Parlamento votó en dos ocasiones en la anterior legislatura su confianza en el Presidente Prodi; en esta legislatura la votó de nuevo en julio y después, con la nueva Comisión en funciones, volvió en septiembre a darle un voto de confianza a toda la Comisión. Por lo tanto, ya ha habido tiempo suficiente para que la Comisión prepare su programa y para que nosotros lo podamos conocer y podamos explicárselo a los ciudadanos. En este sentido recuerdo la resolución del 15 de septiembre, en la que se recomendaba que se presentara la propuesta en el plazo más breve posible.
+Los hechos ocurridos la semana pasada -que se han originado al margen de la Conferencia de Presidentes y utilizándola sólo para corroborar y ratificar decisiones tomadas fuera de ella- plantean un dilema: o bien la Comisión no está en condiciones de presentar ese programa (en ese caso convendría que lo aclarara. Según palabras de su Presidente, está en condiciones de hacerlo. Dado que la Comisión está representada por la Vicepresidenta, Sra. de Palacio, creo que antes de votar sería conveniente conocer la situación de la Comisión en relación con su disponibilidad para presentar el programa, tal como se había convenido); o bien el Parlamento no está en condiciones de examinar este programa, como parece que pretenden algunos. En mi opinión, esta segunda hipótesis significaría hacer dejación de nuestras responsabilidades como Parlamento, además de introducir una tesis original, un método desconocido consistente en dar a conocer a los grupos políticos por escrito el discurso programático de la Comisión una semana antes -y no el día antes, como se había convenido-, teniendo en cuenta que el programa legislativo se discutirá en febrero, de tal manera que podríamos prescindir del debate, porque al día siguiente la prensa e Internet lo habrían dado a conocer a todos los ciudadanos y el Parlamento no tendría ya por qué ocuparse del asunto.
+Como mi Grupo opina que un Parlamento está hecho para escuchar, para debatir y para reflexionar, pensamos que no hay razón alguna que justifique este aplazamiento y creemos que si, la Comisión está en condiciones de hacerlo, estamos perfectamente a tiempo para poder restablecer el acuerdo original entre el Parlamento y la Comisión y proceder con responsabilidad ante nuestras conciudadanas y nuestros conciudadanos. Por lo tanto, la propuesta que hace el Grupo del Partido de los Socialistas Europeos y que su Señoría ha mencionado es que el miércoles se mantenga la presentación del programa de legislatura de la Comisión Prodi, incluyendo dentro de este programa también el proyecto de reforma administrativa porque, de no ser así, nos podemos encontrar con una situación paradójica: con la excusa de que no hay texto, se niega por una parte el derecho al Presidente de la Comisión a hablar en este Parlamento y, por otra parte, que tenga lugar un debate sobre la reforma sin que este Parlamento conozca previamente los textos en que se basa. Por lo tanto, le ruego, señora Presidenta, que pida a la Comisión que se manifieste en este momento y después que se proceda al voto.
+(Aplausos del grupo PSE)
+
+Señora Presidenta, estimados colegas, estoy un tanto sorprendido por la conducta de nuestro colega, el Sr. Barón Crespo, que ahora pide que este punto del orden del día se incluya en el orden del día del miércoles.
+Señor Barón Crespo, usted no pudo asistir el jueves pasado a la Conferencia de Presidentes. No se lo critico; ocurre a veces que se delega la representación. Nuestro colega, el Sr. Hänsch, le representó a usted en la misma. En la Conferencia de Presidentes, tuvimos un debate muy minucioso. Solamente su Grupo mantuvo lo que usted dice ahora. Votamos luego. Cada Presidente o cada Presidenta tiene tantos votos como miembros tiene su Grupo. Hubo una votación sobre este punto. Según recuerdo el resultado de la votación fue el siguiente: 422 votos contra 180 con unas pocas abstenciones. Esto significa que todos los Grupos, con excepción de los que no pertenecen a grupos -los cuales, ciertamente, no constituyen grupo alguno- estaban de acuerdo. Sólo su Grupo opinaba que había que proceder tal como usted acaba de proponer aquí. Todos los demás eran de otra opinión. Así fue el acuerdo.
+Ahora quisiera decir algo sobre el asunto mismo. Nosotros tenemos confianza en la Comisión, en Romano Prodi, y la gran mayoría de nuestro Grupo manifestó su confianza a Romano Prodi y a la Comisión después de un difícil proceso, como todos sabemos. Sin embargo, somos también de la opinión de que debemos celebrar un debate sobre esta estrategia de la Comisión en un procedimiento, no sólo a causa de una explicación oral que ha tenido lugar aquí, en el Parlamento Europeo, sino también a causa de un documento que se ha aprobado en la Comisión y que describe este programa para cinco años. Tal documento no está.
+La Comisión presentará en febrero el programa para el año 2000. Nosotros hemos dicho, bueno, si la Comisión no quiere hacer todavía el Programa 2000 en enero, hagámoslo en febrero. Hemos otorgado nuestra conformidad. En efecto, no queremos tener ninguna disputa con la Comisión, sino que somos de la opinión de que, si es posible, la Comisión y el Parlamento han de marchar por un camino común. Pero, como Parlamento, somos la instancia controladora de la Comisión. Y no todo lo que proceda de la Comisión debe ser opinión nuestra.
+Quisiera que en los Grupos nos pudiéramos preparar razonablemente para un debate sobre el programa para cinco años. No es posible una preparación, si se escucha aquí una declaración y no se sabe cuál es el contenido de tal declaración. Por esta razón, nuestra propuesta -y mi impresión es que la Comisión se encuentra también abierta a estas ideas- es que celebremos en febrero el debate sobre el plan a largo plazo de la Comisión hasta el año 2005 -espero que de aquí a allá la Comisión se ponga también de acuerdo en un programa que tendrá que proponernos- y que nosotros, en febrero, celebremos también, al mismo tiempo, el debate sobre el programa legislativo de la Comisión para el año 2000. Por consiguiente, es un contexto objetivo y sensato el que nos aconseja celebrar conjuntamente el debate sobre ambos programas. Por esta razón mi Grupo rechaza de manera decidida la propuesta del Grupo Socialista.
+(Aplausos del Grupo PPE-DE)
+. Señora Presidenta, quiero dejar muy claro que, ante todo, la Comisión tiene el máximo respeto por las decisiones de este Parlamento y, entre ellas, la de establecer su orden del día. Por lo tanto, nosotros respetamos lo que en este sentido pueda decidir el Parlamento.
+Pero quiero dejar también muy claro que el Presidente Prodi se comprometió con el Parlamento a incorporar un nuevo debate, como ha recordado el Sr. Barón, que se añade al debate anual sobre el programa legislativo de la Comisión, sobre las grandes líneas de actuación para el próximo período de cinco años, es decir, para esta legislatura.
+Quiero decir, señora Presidenta, que este debate se distinguía, en el acuerdo al que se llegó en el mes de septiembre, de lo que es la presentación anual del programa legislativo de la Comisión. Y quiero decir, señora Presidenta, que, por parte de la Comisión, estamos preparados y dispuestos a tener ese debate cuando convenga, que estábamos preparados para desarrollarlo esta semana, como en principio se había acordado, partiendo de la base de que se presentaba la víspera en un discurso a los grupos parlamentarios.
+Por lo tanto, señora Presidenta, quiero reiterar que, por nuestra parte, hemos debatido el programa de actuación para los próximos cinco años y que estamos preparados para, cuando así lo decida el Parlamento, -esta misma semana si ésa es la decisión- venir a exponer el programa para los próximos cinco años y, el mes que viene, el programa para el año 2000, que era lo que estaba perfectamente acordado.
+
+Propongo que votemos la petición del Grupo del Partido de los Socialistas Europeos para volver a incluir la declaración de la Comisión sobre sus objetivos estratégicos.
+(El Parlamento rechaza la petición) El Presidente. Sobre el tema del miércoles, tengo otra propuesta relativa a la pregunta oral sobre el impuesto al capital. El grupo PPE-DE solicita que se retire este punto del orden del día.
+¿Algún colega tomará la palabra en nombre del grupo para justificar esta petición?
+
+Señora Presidenta, escucho algunas risas entre los socialistas. Me han dicho que también amplios círculos del Grupo Socialista ven de buen grado la supresión de este punto del orden del día, ya que en la votación habida en la Conferencia de Presidentes faltó el voto del grupo de trabajo competente para ello de nuestros colegas del Grupo Socialista. Ignoro si esta información es correcta, pero nosotros como Grupo del PPE/DE agradeceríamos en cualquier caso que se suprimiera este punto, ya que el Parlamento se ha ocupado ya numerosas veces de esta cuestión. También existen acuerdos contra semejante impuesto. Por consiguiente, mi Grupo solicita que se suprima este punto del día.
+
+Gracias, señor Poettering.
+Escuchemos ahora al Sr. Wurtz, que hablará en contra de la petición.
+
+Señora Presidenta, ante todo quiero subrayar la falta de lógica del señor Poettering, que acaba de dar una lección al Grupo de los Socialista Europeos para que se vuelva a tratar una decisión que se tomó de un modo absolutamente claro en la Conferencia de Presidentes. Y él hace lo mismo. Hemos discutido, expresamos unanimidad, con excepción de los Grupos del PPE y del Partido Europeo de los Liberales Demócratas y Reformistas, y yo mismo hice notar -como lo recordarán mis queridos compañeros presidentes- que no se trata de saber si están ustedes a favor o en contra del impuesto Todin, sino de saber si se atreven a comprender lo que piensan al respecto la Comisión y el Consejo. No es pedir demasiado. Por lo tanto, reitero la propuesta de mantener esta pregunta oral a la Comisión y al Consejo para saber de una vez por todas cuál es la posición de esos dos órganos en lo que se refiere a esta propuesta relativamente modesta, pero que sería una señal importante para la opinión, sobre todo después de la conmoción que suscitó el fracaso de la Conferencia de Seattle.
+
+Se vota la propuesta del Grupo PPE-DE para retirar del orden del día la pregunta oral referida al impuesto sobre el capital.
+(El Parlamento rechaza la propuesta por 164 votos a favor, 166 votos en contra y 7 abstenciones)
+
+Señora Presidenta, quiero agradecer al señor Poettering la publicidad que acaba de dar a este debate. Gracias.
+
+Señora Presidenta, ¿se ha contabilizado mi voto, que no ha podido ser realizado electrónicamente, porque no tengo la tarjeta? Mi voto era "a favor" .
+
+En efecto, si se suman los dos colegas que han hablado, el resultado sería...
+
+
+Señora Presidenta, la Presidencia ha proclamado el resultado de la votación. No caben modificaciones.
+
+Señorías, repito una vez más que es preciso que todos tengamos la tarjeta. Es evidente que se trata de un problema. En estas circunstancias, debo tomar una decisión.
+También yo he olvidado mi tarjeta y habría votado en contra. Considero, pues, que la pregunta oral se mantiene en el orden del día.
+
+Es la última vez que tomaremos en cuenta las tarjetas olvidadas. Que esto quede bien claro y que se avise a todos.
+(Aplausos)
+Sí, la pregunta oral se mantiene en el orden del día y sí, la Presidenta tiene el derecho de votar, como también tiene el derecho de olvidar su tarjeta.
+Continuamos con las otras modificaciones del orden del día.1
+
+Señora Presidenta, en la votación anterior -y me atendré a su decisión en este asunto- sobre la cuestión del plan estratégico de la Comisión, indiqué que me habría gustado hablar antes de la votación en nombre de mi Grupo. Esto no ha ocurrido. Le agradecería que, al cierre de este punto, se me permitiera dar una explicación del voto en nombre de mi Grupo. Es un asunto importante. Sería útil que el historial de la Cámara registrara cómo percibe la gente lo que hemos hecho a la luz de sus propios análisis políticos.
+
+Señora Presidenta, no deseo reanudar el debate, pero había pedido también la palabra para dar mi opinión acerca de la enmienda del Sr. Barón Crespo. Tampoco me ha nombrado usted. Lo lamento, pero la votación se ha realizado, se ha adoptado la decisión y, por consiguiente, dejemos así las cosas.
+
+Lo siento mucho, señor Hänsch, señor Cox, no he advertido que ustedes pedían la palabra. En estas circunstancias, creo que las posiciones están claras y que se reflejarán en el Acta. Cuando mañana se trate la aprobación del Acta de la sesión de hoy, si Sus Señorías estiman que las posiciones no se han explicado lo bastante bien, podrán pedir modificaciones. Creo que es una buena fórmula. Por supuesto que el Acta de la sesión de mañana consignará todas las explicaciones complementarias. Creo que esta fórmula es mejor que la de proceder ahora a unas explicaciones de voto que nos llevarían mucho tiempo. Sr. Hänsch, Sr. Cox, ¿les parece bien?
+
+ Señora Presidenta, si en el registro de la votación consta correctamente cómo ha votado mi Grupo, ni quiero ni puedo plantear objeción alguna. Si su decisión es que no podemos explicar nuestro voto, la acataré, pero no sin reservas.
+
+Examinaremos con cuidado la redacción del Acta, aunque es algo que siempre hacemos. Si no refleja bien las posiciones, se podrá corregir.
+
+(El Parlamento aprueba el orden de los trabajos así modificado)
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/nl.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/nl.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/nl.test (revision 0)
@@ -0,0 +1,105 @@
+Hervatting van de zitting
+Ik verklaar de zitting van het Europees Parlement, die op vrijdag 17 december werd onderbroken, te zijn hervat. Ik wens u allen een gelukkig nieuwjaar en hoop dat u een goede vakantie heeft gehad.
+Zoals u heeft kunnen constateren, is de grote "millenniumbug" uitgebleven. De burgers van een aantal van onze lidstaten zijn daarentegen door verschrikkelijke natuurrampen getroffen. U heeft aangegeven dat u deze vergaderperiode een debat wilt over deze rampen. Nu wil ik graag op verzoek van een aantal collega's een minuut stilte in acht nemen ter nagedachtenis van de slachtoffers. Ik doel hiermee met name op de slachtoffers van het noodweer dat verschillende lidstaten van de Unie heeft geteisterd. Ik wil u vragen deze minuut stilte staande in acht te nemen.
+(Het Parlement neemt staande een minuut stilte in acht)
+
+Mevrouw de Voorzitter, ik wil een motie van orde stellen. U zult via de media hebben vernomen dat er zich in Sri Lanka een aantal bomexplosies en schietpartijen hebben voorgedaan. Een van de mensen die zeer recent in Sri Lanka is vermoord, is de heer Kumar Ponnambalam, die een paar maanden geleden nog een bezoek bracht aan het Europees Parlement. Zou u, mevrouw de Voorzitter, wellicht een brief kunnen schrijven aan de President van Sri Lanka, waarin u laat weten dat uzelf en het Europees Parlement deze moord en de overige brute moorden in Sri Lanka diep betreuren, en waarin u haar oproept al het nodige te doen om in deze zeer moeilijke situatie langs vreedzame weg tot verzoening te komen?
+
+Ja, mijnheer Evans, ik denk dat een dergelijk initiatief zeer gepast zou zijn. Als het Parlement ermee instemt, geef ik graag gevolg aan uw suggestie.
+
+ Mevrouw de Voorzitter, ik wil een motie van orde stellen. Ik vraag uw advies over artikel 143 van het Reglement, met betrekking tot niet-ontvankelijkheid. Mijn vraag betreft een zaak die voor donderdag op de agenda staat en waarop ik dan opnieuw zal ingaan.
+Het verslag Cunha, over het resultaat van de meerjarige oriëntatieprogramma's voor de vissersvloot, wordt donderdag in het Parlement besproken. In artikel 6 van dit verslag wordt voorgesteld een soort strafkorting op vangstquota toe te passen voor lidstaten die zich niet houden aan de jaarlijkse doelstellingen voor vlootinkrimping. Dit zou moeten gebeuren in weerwil van het beginsel van relatieve stabiliteit. Naar mijn mening is de relatieve stabiliteit een grondbeginsel van het gemeenschappelijk visserijbeleid, en zou een voorstel om dit te ondermijnen juridisch niet-ontvankelijk zijn. Ik zou graag willen weten of een dergelijk bezwaar kan worden ingebracht tegen enkel een verslag, dus niet een ontwerpwetgevingsvoorstel, en of ik aanstaande donderdag gerechtigd ben dit te doen.
+
+Dat is inderdaad het juiste moment om dit vraagstuk ter tafel te brengen, dat wil zeggen donderdag voordat het verslag wordt gepresenteerd.
+
+Mevrouw de Voorzitter, helaas valt de eerste vergaderperiode van het Europees Parlement in het nieuwe jaar samen met de executie van een jonge terdoodveroordeelde van 34 jaar, Hicks genaamd. Deze executie is door de staat Texas van de Verenigde Staten vastgesteld voor aanstaande donderdag.
+Op initiatief van een van de Franse afgevaardigden, de heer Zimeray, is al een petitie aangeboden, die door velen is ondertekend, onder andere door mij. Maar ik wil u vragen om, in uw hoedanigheid van Voorzitter van het Europees Parlement, uw invloed aan te wenden bij de president en de gouverneur van de staat Texas, de heer Bush, die de macht heeft om de terdoodveroordeling op te schorten en de veroordeelde gratie te verlenen, in overeenstemming met het standpunt van het Europees Parlement en de gehele Europese Gemeenschap, zoals dat herhaaldelijk naar voren is gekomen.
+Bovendien is een dergelijke actie in overeenstemming met onze grondbeginselen.
+
+Hartelijk dank, mijnheer Segni, dat wil ik graag doen. Het ligt ook geheel in de lijn van de standpunten die ons Parlement altijd met betrekking tot dergelijke vraagstukken heeft ingenomen.
+
+Mevrouw de Voorzitter, ik zou op een geval willen wijzen waarmee dit Parlement zich keer op keer bezig heeft gehouden, het geval-Alexander Nikitin. We zijn allemaal blij dat de rechter hem heeft vrijgesproken en duidelijk heeft gemaakt dat ook in Rusland het recht op toegang tot informatie over het milieu door de grondwet wordt gegarandeerd. Hij schijnt echter weer voor de rechter te moeten verschijnen, omdat de officier van justitie in beroep gaat. We weten allemaal, en hebben dat ook gezegd in talloze resoluties, onder andere nog tijdens de laatste plenaire vergadering vorig jaar, dat dit niet alleen een geval voor juristen is, en dat het verkeerd is Alexander Nikitin te beschuldigen van misdrijven en verraad. Wij zijn namelijk direct betrokken bij de resultaten van zijn onderzoek en profiteren ervan. Deze resultaten vormen de basis voor de Europese programma' s voor de bescherming van de Barentszzee, en daarom zou ik u willen vragen een brief te bestuderen waarin de belangrijkste feiten worden samengevat, en een standpunt te bepalen over de besluiten van het Russische parlement.
+
+Mevrouw Schroedter, nadat ik uw brief ontvangen heb, zal ik de feiten die op dit vraagstuk betrekking hebben, zeker bestuderen.
+
+Voorzitter, ik zou u eerst een compliment willen maken met het feit dat u woord hebt gehouden en dat inderdaad nu in deze eerste vergaderperiode in het nieuwe jaar het aantal televisiezenders op onze kamer daadwerkelijk enorm is uitgebreid. Maar, Voorzitter, er is niet gebeurd waar ik om had gevraagd. Er zijn nu weliswaar twee Finse zenders en een Portugese zender, maar er is nog steeds geen Nederlandse zender en ik had u gevraagd om een Nederlandse zender, omdat ook Nederlanders graag het nieuws willen volgen, iedere maand als wij hier naar dit verbanningsoord worden gestuurd. Dus ik zou u nogmaals willen vragen om er toch zorg voor te dragen dat wij ook een Nederlandse zender krijgen.
+
+Mevrouw Plooij-van Gorsel, ik kan u mededelen dat dit vraagstuk op de agenda van de vergadering van het College van quaestoren van aanstaande woensdag staat. Het zal, naar ik hoop, op bevredigende wijze worden opgelost.
+
+Mevrouw de Voorzitter, kunt u mij uitleggen waarom dit Parlement zich niet houdt aan gezondheids- en veiligheidsvoorschriften die het zelf vaststelt? Waarom is de kwaliteit van de lucht in dit gebouw nooit onderzocht sinds de verkiezingen? Waarom heeft het Comité voor veiligheid en hygiëne sinds 1998 niet meer vergaderd? Waarom is er noch in het Parlementsgebouw in Brussel noch hier in Straatsburg een brandweeroefening gehouden? Waarom zijn er nergens instructies over wat te doen in geval van brand? Waarom zijn er sinds mijn ongeval geen verbeteringen aangebracht aan de trappen? Waarom wordt het rookverbod niet gehandhaafd in daarvoor aangewezen delen van het gebouw? Het is absoluut onaanvaardbaar dat wij wetgeving goedkeuren en dat wij ons daar zelf niet aan houden.
+
+Mevrouw Lynne, u hebt volkomen gelijk. Ik zal nagaan of dit inderdaad niet gebeurd is. Ik zal het vraagstuk verder aan het College van quaestoren voorleggen. Ik ben ervan overtuigd dat onze quaestoren ervoor zullen zorgdragen dat de wetgeving waarover we ons hebben uitgesproken, ook daadwerkelijk wordt nageleefd.
+
+Mevrouw de Voorzitter, mevrouw Díez González en ikzelf hadden samen een aantal vragen gesteld naar aanleiding van bepaalde uitspraken van commissaris de Palacio in een Spaans dagblad. De voor de agenda verantwoordelijke diensten hebben die vragen niet op de agenda geplaatst, daar die vragen al in een andere vergaderperiode beantwoord zouden zijn.
+Daar dat niet zo is, verzoek ik het desbetreffende besluit te heroverwegen. De eerder beantwoorde vragen betreffen de bijdrage van mevrouw de Palacio over een ander dossier en gaan niet over de uitspraken die 18 november jongstleden in de krant ABC zijn verschenen.
+
+Waarde collega, we zullen dit alles natrekken. Ik moet u bekennen dat ik de situatie nu enigszins verwarrend vind. We zullen daarom deze kwestie zorgvuldig nagaan en correct volgens de regels handelen.
+
+Mevrouw de Voorzitter, ik zou graag willen weten of het Parlement deze week duidelijk zijn ongenoegen zal laten blijken over het vandaag genomen besluit het wapenembargo tegen Indonesië niet te verlengen. De overgrote meerderheid van het Parlement heeft zich in het verleden immers uitgesproken voor dit embargo.Gezien de situatie in Indonesië is het besluit het embargo niet te verlengen uiterst riskant. Het Parlement moet dan ook een signaal afgeven, aangezien een grote meerderheid dit wenst.Dat de lidstaten van de Europese Unie weigeren het embargo te verlengen, is zonder meer onverantwoordelijk, de explosieve situatie in het land in aanmerking nemend. Het gevaar van een militaire coup is niet denkbeeldig.Wij weten niet wat er aan de hand is. Waarom zouden EU-wapenfabrikanten moeten profiteren van een situatie die ten koste gaan van onschuldige mensen?
+
+Dit punt staat op dit moment in ieder geval niet voor het actualiteitendebat van donderdag ingeschreven.
+
+Regeling van de werkzaamheden
+Aan de orde is de behandeling van de definitieve ontwerpagenda zoals deze op de Conferentie van voorzitters op donderdag 13 januari is vastgesteld overeenkomstig artikel 110 van het Reglement. Ik heb geen wijzigingen voor de maandag en de dinsdag.
+Woensdag 19 januari:
+De socialistische fractie vraagt om inschrijving van een verklaring van de Commissie over haar strategische doelstellingen voor de komende vijf jaar alsmede over de bestuurlijke hervorming van de Commissie.
+Ik zou de heer Barón Crespo willen vragen zijn verzoek om inschrijving hier toe te lichten. Vervolgens zullen we de gebruikelijke procedure volgen, dat wil zeggen dat we een voorstander en een tegenstander van dit verzoek het woord zullen geven.
+
+Mevrouw de Voorzitter, de presentatie van het politieke programma van de Commissie Prodi voor de hele legislatuur was oorspronkelijk een voorstel van Fractie van de Partij van de Europese Sociaal-Democraten, dat in september de unanieme steun kreeg van de Conferentie van voorzitters. Ook de heer Prodi gaf er uitdrukkelijk zijn steun aan, en in de rede waarmee hij zijn benoeming aanvaardde, heeft hij die toezegging nog eens herhaald.
+Die toezegging is vooral belangrijk omdat de Commissie volgens de Verdragen het monopolie heeft op het initiatiefrecht en dus eigenlijk vorm geeft aan wat de komende vijf jaar de politieke en de wetgevende activiteit van dit Parlement zal zijn. Bovendien wil ik eraan herinneren, mevrouw de Voorzitter, dat dit Parlement in de vorige legislatuur tweemaal zijn vertrouwen heeft uitgesproken in de heer Prodi als voorzitter van de Commissie. Tijdens de nieuwe legislatuur is dat vertrouwen nogmaals uitgesproken in juli, en na het aantreden van de voltallige nieuwe Commissie is dat vertrouwen in september aan de hele Commissie geschonken. Er is derhalve in theorie voldoende tijd geweest voor de Commissie om haar programma op te stellen en voor ons om er dan kennis van te nemen en uitleg te geven aan de burgers. In dit verband wil ik wijzen op de resolutie van 15 september, waarin de Commissie de aanbeveling kreeg het voorstel zo snel mogelijk in te dienen.
+De gebeurtenissen van de vorige week in de marge van de Conferentie van voorzitters, waarbij de Conferentie van voorzitters alleen maar gebruikt is om elders genomen besluiten te bekrachtigen en te ratificeren, plaatsen ons voor een dilemma: ofwel de Commissie is niet in staat dat programma te presenteren, ofwel, zoals sommigen schijnen te beweren, het Parlement is niet in staat dat programma te behandelen. In het eerste geval zou de Commissie haar onvermogen moeten toelichten, want volgens de voorzitter van de Commissie is de Commissie klaar voor de presentatie. Daar de Commissie hier vertegenwoordigd is door haar vice-voorzitter mevrouw de Palacio, denk ik dat het gepast zou zijn om voor wij gaan stemmen van de Commissie te horen hoe het zit met haar bereidheid het programma te presenteren zoals is afgesproken. Naar mijn mening houdt de tweede hypothese in dat wij als Parlement onze verantwoordelijkheid verwaarlozen. Volgens een tot nu onbekende procedure krijgen de fracties een week van tevoren - en niet zoals afgesproken één dag van tevoren - de geschreven toespraak over het programma van de Commissie. Bovendien is dit wel een zeer originele thesis, want het wetgevingsprogramma wordt in februari behandeld. Wij zouden dan ook kunnen afzien van het debat over dat programma, daar de dag nadat de fracties het gekregen hebben alle burgers dan via de pers en Internet geïnformeerd zouden zijn en het Parlement niets meer met het onderwerp zou kunnen doen.
+Daar onze fractie meent dat het de taak is van een parlement om te luisteren, te debatteren en na te denken, geloven wij dat er geen enkele reden is die dit uitstel rechtvaardigt. Ook menen wij dat indien de Commissie in staat is het programma te presenteren, wij zeker nog de tijd hebben om terug te komen op de oorspronkelijke afspraak tussen het Parlement en de Commissie, en tegenover onze medeburgers op verantwoordelijke wijze te werk te gaan. Derhalve doet de Fractie van de Partij van de Europese Sociaal-Democraten het voorstel dat door u genoemd is, mevrouw de Voorzitter, om woensdag de presentatie van het programma voor de hele legislatuur van de Commissie Prodi te handhaven. Bij dat programma hoort ook de administratieve hervorming van de Commissie, want anders zouden wij met een paradoxale situatie te maken kunnen krijgen. Onder het voorwendsel dat er geen tekst is, wordt namelijk aan de ene kant de voorzitter van de Commissie het recht ontzegd voor dit Parlement te spreken en wordt er aan de andere kant een debat gehouden over de hervorming, terwijl het Parlement de teksten daarvan niet van tevoren kent. Daarom verzoek ik u, mevrouw de Voorzitter, eerst de Commissie te vragen om haar mening te laten horen en daarna te laten stemmen.
+(Applaus van de PSE-fractie)
+
+Mevrouw de Voorzitter, geachte collega's, de houding van de heer Barón Crespo verbaast me wel een beetje. Hij wil dit punt op de agenda van woensdag plaatsen.
+Mijnheer Barón Crespo, u kon niet deelnemen aan de vergadering van de Conferentie van voorzitters op donderdag jongstleden. Daar heb ik het volste begrip voor; het kan altijd gebeuren dat iemand een plaatsvervanger moet sturen. De heer Hänsch heeft u vertegenwoordigd. Tijdens de vergadering van de Conferentie van voorzitters hebben we een uitvoerig debat gevoerd. Uw fractie was de enige die voorstelde wat u hier nu wilt. Daarover hebben we gestemd. Iedere voorzitter heeft zoveel stemmen als zijn of haar fractie leden heeft. Als ik me niet vergis, was het resultaat 422 stemmen tegen 180, bij slechts een paar onthoudingen. Dat betekent dat alle fracties het met elkaar eens waren, behalve de niet-ingeschreven leden, en die vormen geen fractie. Alleen uw fractie heeft voor het voorstel gestemd dat u hier herhaalt. De anderen waren het niet met u eens, en het besluit is genomen.
+Nu wil ik nog even op de zaak zelf ingaan. Wij hebben vertrouwen in de Commissie, in Romano Prodi, en zoals u allemaal weet, heeft de overwegende meerderheid van onze fractie Romano Prodi en de Commissie na een moeizaam proces het vertrouwen geschonken. We vinden echter ook dat we het debat over de strategie van de Commissie volgens de juiste procedure moeten voeren, en niet zomaar naar aanleiding van een mondelinge verklaring hier in het Europees Parlement. We hebben daarvoor ook een document nodig, dat door de Commissie is goedgekeurd en dit vijfjarig programma beschrijft. Een dergelijk document bestaat echter niet!
+De Commissie zal het programma voor 2000 in februari voorstellen. We hebben gezegd: goed, als de Commissie het programma voor 2000 nog niet in januari wil voorstellen, dan moet dat maar in februari. We hebben daarmee ingestemd. Wij willen tenslotte helemaal geen ruzie met de Commissie; wij vinden dat de Commissie en het Europees Parlement als het enigszins mogelijk is een gezamenlijke weg moeten vinden. Als Parlement zijn we echter ook verantwoordelijk voor de controle van de Commissie. Wat van de Commissie komt, is niet altijd ook ons standpunt.
+Ik ben van mening dat de fracties zich gedegen moeten kunnen voorbereiden op het debat over het vijfjarig programma. Naar een verklaring luisteren en van tevoren helemaal niet weten wat de inhoud van die verklaring is, dat is geen goede voorbereiding. Daarom stellen wij voor - en ik heb de indruk dat de Commissie wel openstaat voor dit idee - dat we in februari het debat voeren over het langetermijnprogramma van de Commissie voor de periode tot 2005. Ik hoop dat de Commissie het tegen die tijd eens is geworden over het programma dat ze dan aan ons zal voorleggen. Wij stellen echter voor dat we tegelijkertijd in februari het debat voeren over het wetgevend programma van de Commissie voor 2000. Er zijn goede inhoudelijke redenen om het debat over die twee programma' s samen te voeren. Daarom wijst mijn fractie het voorstel van de socialistische fractie met nadruk van de hand!
+(Applaus van de PPE-DE-Fractie)
+
+Mevrouw de Voorzitter, allereerst wil ik duidelijk maken dat de Commissie alle respect heeft voor de besluiten die dit Parlement neemt, met inbegrip van het opstellen van de agenda. Derhalve respecteren wij wat het Parlement in dit verband zal besluiten.
+Maar ik wens ook duidelijk te maken dat voorzitter Prodi zich tegenover het Parlement verplicht heeft, zoals de heer Barón in herinnering heeft geroepen, om naast het jaarlijks debat over het wetgevingsprogramma van de Commissie een nieuw debat te houden over de grote lijnen van het beleid voor de komende vijf jaar, dat wil zeggen voor deze hele legislatuur.
+Ik wil erop wijzen, mevrouw de Voorzitter, dat dat debat zich volgens het in septembere bereikte akkoord zou onderscheiden van het debat over het jaarlijks wetgevingsprogramma van de Commissie. Ook wil ik laten weten, mevrouw de Voorzitter, dat wij als Commissie bereid en klaar zijn om dat debat op het gepaste moment te houden. Wij waren ook klaar voor een debat gedurende deze week, zoals in beginsel was afgesproken, met dien verstande dat de dag voor het debat het woord aan de fracties zou worden gegeven.
+Daarom wil ik herhalen, mevrouw de Voorzitter, dat wij als Commissie het beleidsprogramma voor de komende vijf jaar besproken hebben en dat, indien het Parlement zo mocht besluiten - eventueel nog deze week -, wij exact volgens de afspraak klaar zijn om dit programma voor de komende vijf jaar te komen toelichten en om de volgende maand hetzelfde te doen met het programma voor het jaar 2000.
+
+Ik stel voor dat we gaan stemmen over het verzoek van de socialistische fractie om de verklaring van de Commissie over haar strategische doelstellingen opnieuw in te schrijven.
+(Het Parlement verwerpt het verzoek)
+Nog altijd met betrekking tot de woensdag heb ik een ander verzoek ontvangen. De PPE-DE-Fractie wil dat de mondelinge vragen over hoofdelijke belasting van de agenda worden geschrapt.
+Welke vertegenwoordiger van deze fractie wil het woord voeren om dit verzoek toe te lichten?
+
+Mevrouw de Voorzitter, ik heb wat gelach gehoord van de banken van de socialistische fractie. Ik heb ook gehoord dat veel leden van die fractie dit punt graag van de agenda zouden willen afvoeren, omdat ten tijde van de stemming in de Conferentie van voorzitters het standpunt van de socialistische leden van de werkgroep die zich met deze zaken bezig houdt, nog niet beschikbaar was. Ik weet niet of dat klopt, maar wij als PPE-DE-Fractie zouden dankbaar zijn als dit punt van de agenda zou kunnen worden afgevoerd. Het Parlement heeft zich namelijk al meerdere malen met deze kwestie bezig gehouden. Er is ook al besloten om deze belasting af te wijzen. Daarom vraagt mijn fractie dit punt van de agenda af te voeren.
+
+Hartelijk dank, mijnheer Poettering.
+We geven nu de heer Wurtz de gelegenheid om zich tegen dit verzoek uit te spreken.
+
+Mevrouw de Voorzitter, ik wil allereerst benadrukken dat de logica in het betoog van de heer Poettering ver te zoeken is. Zojuist heeft hij de socialistische fractie de les gelezen omdat deze fractie terugkomt op een besluit dat overduidelijk tijdens de Conferentie van voorzitters is genomen. Vervolgens handelt hij op precies dezelfde wijze als deze fractie. Wij hebben over dit vraagstuk gedebatteerd en waren, met uitzondering van de PPE-DE-Fractie en de liberale fractie, allen dezelfde mening toegedaan. Zoals u zich herinnert, heb ik opgemerkt, waarde collega-voorzitters, dat het er niet zozeer toe doet of u voor of tegen de Todin-heffing bent, maar dat u van de Commissie en de Raad durft te verlangen dat ze hun mening over dit vraagstuk kenbaar maken. Dat is toch niet teveel gevraagd. Ik herhaal dus mijn voorstel om deze mondelinge vraag aan de Commissie en de Raad te handhaven zodat we voor eens en altijd weten hoe deze twee instellingen over dit relatief eenvoudige verzoek denken. We kunnen zo immers een belangrijk signaal aan de burgers afgeven, zeker na de commotie die na het mislukken van de Conferentie van Seattle is ontstaan.
+
+We gaan stemmen over het verzoek van de PPE-DE-Fractie om de mondelinge vragen over hoofdelijke belasting van de agenda te schrappen.
+(Het Parlement verwerpt het verzoek met 164 stemmen voor, 166 stemmen tegen en 7 onthoudingen)
+
+Mevrouw de Voorzitter, ik wil de heer Poettering er hartelijk voor danken dat hij dit debat zo effectief onder de aandacht heeft gebracht. Hartelijk dank.
+
+Mevrouw de Voorzitter, is mijn stem die ik elektronisch niet heb kunnen uitbrengen omdat ik mijn stemkaart niet bij mij heb, meegeteld? Ik was vóór.
+
+Inderdaad, als we de stemmen van beide collega's die van zich hebben laten horen bij de uitslag optellen, dan wordt het resultaat...
+
+Mevrouw de Voorzitter, u heeft de uitslag van de stemming bekendgemaakt. Daaraan mag niets veranderd worden.
+
+Waarde collega's, ik wil nogmaals benadrukken dat iedereen zijn kaart voor maandag bij zich moet hebben. We hebben nu een probleem en ik zal daarom een beslissing moeten nemen.
+Ik ben mijn kaart ook vergeten en zou anders tegen hebben gestemd. Ik vind dus dat de mondelinge vraag op de agenda moet blijven staan.
+Dit is de laatste keer dat we rekening houden met collega's die hun kaart vergeten zijn. Laat dit nu voor eens en altijd duidelijk zijn.
+(Applaus)Ja, de mondelinge vraag blijft op de agenda gehandhaafd, en ja, de Voorzitter heeft het recht om te stemmen. Ze heeft immers ook het recht haar kaart te vergeten.
+We gaan nu verder met de andere wijzigingen in de agenda.
+
+Mevrouw de Voorzitter, laat mij vooropstellen dat ik mij zal neerleggen bij uw uitspraak in dezen, maar bij de eerdere stemming over de Commissiestrategie had ik voorafgaand aan de stemming namens mijn fractie het woord willen voeren. Dit is niet gebeurd. Ik zou het waarderen indien ik na afsluiting van dit punt de gelegenheid zou krijgen namens mijn fractie een stemverklaring uit te spreken. Het gaat om een belangrijke kwestie. Het is een goede zaak voor dit Parlement dat wordt vastgelegd, hoe de mensen vanuit hun eigen politieke analyse de zojuist genomen beslissing beoordelen.
+
+Mevrouw de Voorzitter, ik wil het debat niet opnieuw openen, maar ik had ook om het woord gevraagd. Ik wilde ingaan op het verzoek van de heer Barón Crespo. U heeft mij het woord niet verleend. Ik vind dat jammer, maar we hebben nu gestemd en een besluit genomen. Daar wil ik het bij laten.
+
+Mijn excuses, mijnheer Hänsch en mijnheer Cox, ik had niet in de gaten dat u om het woord vroeg. Ik denk dat de stellingname in de notulen zal worden weergegeven. Bij de goedkeuring van notulen van de vergadering van vandaag kunnen de collega's die vinden dat de standpunten niet goed zijn weergegeven, een verzoek tot wijziging indienen. Ik denk dat dit een goede oplossing is. Uiteraard zal in de notulen van de vergadering van morgen rekening gehouden worden met al deze aanvullende verklaringen. Ik denk dat dit beter is dan nu stemverklaringen af te leggen. We zouden dan immers teveel afdwalen. Mijnheer Cox en mijnheer Hänsch, kunt u zich in mijn voorstel vinden?
+
+Mevrouw de Voorzitter, als het stemgedrag van mijn fractie correct is weergegeven, zal en kan ik hiertegen geen bezwaar maken. Indien uw besluit is dat ik geen stemverklaring mag afleggen, dan accepteer ik dat, zij het onder voorbehoud.
+
+We zullen dus heel goed opletten bij het opstellen van de notulen. Dat doen we trouwens altijd al. Als de standpunten niet goed in de notulen worden weergegeven, kunnen deze eventueel worden aangepast.
+(Het Parlement neemt de aldus gewijzigde agenda aan)
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/it.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/it.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/it.test (revision 0)
@@ -0,0 +1,109 @@
+Ripresa della sessione
+Dichiaro ripresa la sessione del Parlamento europeo, interrotta venerdì 17 dicembre e rinnovo a tutti i miei migliori auguri nella speranza che abbiate trascorso delle buone vacanze.
+Come avrete avuto modo di constatare il grande "baco del millennio" non si è materializzato. Invece, i cittadini di alcuni nostri paesi sono stati colpiti da catastrofi naturali di proporzioni davvero terribili. Avete chiesto che si tenesse una discussione su tale tema nei prossimi giorni, nel corso della presente tornata. Nel frattempo è mio desiderio, come del resto mi è stato chiesto da alcuni colleghi, osservare un minuto di silenzio in memoria di tutte le vittime delle tempeste che si sono abbattute sui diversi paesi dell' Unione europea. Vi invito pertanto ad alzarvi in piedi per osservare appunto un minuto di silenzio.
+(Il Parlamento osserva un minuto di silenzio)
+
+Signora Presidente, intervengo per una mozione d'ordine. Come avrà letto sui giornali o sentito alla televisione, in Sri Lanka si sono verificati numerosi assassinii ed esplosioni di ordigni. Una delle vittime più recenti è stato Kumar Ponnambalam, che qualche mese fa era venuto in visita qui al Parlamento europeo. Signora Presidente, sarebbe opportuno che inviasse una lettera alla Presidente del Sri Lanka per esprimere le condoglianze del Parlamento per questa e le altre morti violente verificatesi in Sri Lanka e per invitarla a fare quanto in suo potere al fine di giungere a una riconciliazione pacifica in questa situazione assai difficile.
+
+Sì, onorevole Evans, ritengo che un' iniziativa del tipo che lei propone sia assolutamente opportuna. Se l' Assemblea è d' accordo seguirò il suggerimento dell' onorevole Evans.
+
+Signora Presidente, un richiamo al Regolamento. Gradirei avere il suo parere riguardo all'articolo 143 sull'inammissibilità. La mia domanda si ricollega a un tema all'ordine del giorno di giovedì e che formulerò di nuovo al momento opportuno.
+La relazione Cunha sui programmi di orientamento pluriennali è iscritta all'ordine del giorno della Plenaria di giovedì e al paragrafo 6 contiene una proposta volta a introdurre una sorta di sanzione a carico delle quote di quei paesi che non riescono a raggiungere i loro obiettivi di riduzione annuali delle flotte, nonostante il principio della stabilità relativa. Credo che tale principio sia un principio giuridico fondamentale della politica comune della pesca e qualsiasi proposta volta a sovvertirlo sarebbe giuridicamente inammissibile Vorrei sapere se è possibile sollevare un'obiezione di questo tipo nel contesto di una semplice relazione, e non di una proposta legislativa, e se rientra nelle mie competenze sollevare una tale obiezione giovedì prossimo.
+
+E' appunto in quell' occasione che, se lo desidera, avrà modo di sollevare la sua questione pregiudiziale, cioè giovedì in apertura della discussione sulla relazione.
+
+Signora Presidente, in coincidenza con la prima tornata dell'anno del Parlamento europeo, negli Stati Uniti in Texas è stata fissata, purtroppo per giovedì prossimo, l'esecuzione di un condannato a morte, un giovane di 34 anni che chiameremo di nome Hicks.
+Su richiesta di un deputato francese, l'onorevole Zimeray, è già stata presentata una petizione, che ha avuto molti firmatari tra cui il sottoscritto, ma le chiedo, in conformità con l'indirizzo ormai costantemente espresso dal Parlamento europeo e da tutta la Comunità europea, di intervenire, con il prestigio della sua carica e dell'Istituzione che lei rappresenta, presso il Presidente e il Governatore del Texas Bush, che ha il potere di sospendere la condanna a morte e di graziare il condannato.
+E tutto ciò in conformità con i principi che abbiamo sempre sostenuto.
+
+La ringrazio, onorevole Segni, lo farò volentieri. In effetti ciò è assolutamente conforme alla posizione che il nostro Parlamento ha sempre sostenuto.
+
+Signora Presidente, vorrei richiamare l'attenzione su un caso che il Parlamento segue da tempo, ossia il caso di Alexander Nikitin. Noi tutti siamo lieti che il tribunale lo abbia assolto, ribadendo che anche in Russia l'accesso a informazioni sull'ambiente è un diritto sancito dalla costituzione. Ora, però, verrà messo nuovamente in stato di accusa perché il pubblico ministero ricorrerà in appello. Come sappiamo e come abbiamo fatto rilevare in innumerevoli risoluzioni - anche nell'ultima seduta plenaria dell'anno scorso - non si tratta semplicemente di un caso giudiziario ed è un grave errore accusare Alexander Nikitin di aver commesso reati e atti criminali, tanto più che noi, in quanto diretti interessati, abbiamo beneficiato dei risultati delle sue ricerche. Tali risultati sono alla base dei programmi europei di tutela del Mare di Barents. La prego pertanto di prendere in esame la bozza della lettera in cui vengono indicati i fatti principali e di sostenere presso le autorità russe la posizione assunta dal Parlamento, conformemente alle sue risoluzioni.
+
+Sì, onorevole Scroedter, esaminerò volentieri i fatti relativi alla questione da lei esposta non appena avrò ricevuto la sua lettera.
+
+Signora Presidente, mi permetta di farle innanzi tutto i miei complimenti per aver tenuto fede alla parola data. In effetti il numero di canali televisivi disponibili nei nostri uffici è aumentato enormemente in questa prima tornata dell'anno nuovo. Tuttavia, signora Presidente, non è ancora stato dato seguito alla mia richiesta. E' vero che adesso abbiamo due canali finlandesi e uno portoghese, ma purtroppo manca ancora il canale olandese. Ed era proprio quello che avevo chiesto, dato che noi parlamentari olandesi, quando veniamo spediti in questo esilio mensile, gradiremmo poter vedere il telegiornale in olandese. Ripeto ancora una volta la mia richiesta: faccia in modo che sia reso disponibile anche un canale olandese.
+
+Onorevole Plooj-van Gorsel, posso risponderle che tale punto figura all' ordine del giorno della riunione dei questori di mercoledì. Spero che sarà esaminata con uno spirito positivo.
+
+Signora Presidente, vorrei sapere perché questo Parlamento non rispetta le norme in materia di salute e sicurezza che esso stesso approva. Perché non è stato condotto alcun test della qualità dell'aria in questo edificio da quando siamo stati eletti? Perché dal 1998 il comitato salute e sicurezza non si è più riunito? Perché non sono state fatte prove dell'allarme antincendio né negli edifici del Parlamento di Bruxelles né qui a Strasburgo? Perché non esistono istruzioni da seguire in caso di incendio? Perché dopo il mio incidente non sono state apportate migliorie alle scale? Perché non viene fatto rispettare il divieto di fumare nelle aree riservate appunto ai non fumatori? E' assolutamente vergognoso che proprio noi non rispettiamo le norme da noi stessi approvate.
+
+Onorevole Lynne, lei ha perfettamente ragione e intendo verificare se tutto quanto lei ha detto davvero non è stato fatto. Intendo altresì sottoporre il punto al collegio dei questori e sono certa che ai nostri questori starà a cuore fare in modo che il Parlamento osservi le disposizioni che approva.
+
+Signora Presidente, l' onorevole Díez González e io avevamo presentato alcune interrogazioni in merito a determinate opinioni della Vicepresidente de Palacio riferite da un giornale spagnolo. I servizi competenti non le hanno inserite all' ordine del giorno, in quanto hanno ritenuto che avessero già ottenuto risposta in una tornata precedente.
+Chiedo che venga riesaminata tale decisione, in quanto non è così. Le interrogazioni cui è stata data risposta in precedenza riguardavano un intervento della Commissario de Palacio in un caso determinato, non le dichiarazioni pubblicate dal giornale ABC il 18 novembre scorso.
+
+Onorevole collega, sarà mia cura verificare tale punto. Devo confessarle che in questo momento la questione mi pare un po' confusa. Quindi verificheremo con estrema attenzione per essere certi che tutto sia corretto.
+
+Signora Presidente, gradirei sapere se questa settimana il Parlamento intende lanciare un segnale chiaro per esprimere il nostro scontento riguardo alla decisione presa oggi di rifiutare il rinnovo dell'embargo sulle armi contro l' Indonesia, visto e considerato che in passato la stragrande maggioranza dei deputati aveva sostenuto l'imposizione dell'embargo all'Indonesia. La decisione odierna di non rinnovarlo è pericolosissima, data la situazione sul posto. Il Parlamento dovrebbe pertanto inviare un messaggio, come auspica la stragrande maggioranza dei deputati. Gli Stati membri dell'Unione sono stati irresponsabili a non rinnovare l'embargo. Com'è già stato detto, la situazione in Indonesia è davvero esplosiva, con un forte rischio che in futuro si verifichi un colpo di Stato. Non sappiamo cosa stia succedendo e quindi mi chiedo perché si debba permettere ai produttori di armi dell'UE di trarne profitto a scapito di persone innocenti.
+
+Comunque sia, questo punto non è previsto nelle discussioni sui problemi di attualità di giovedì.
+
+Ordine dei lavori
+L' ordine del giorno reca la fissazione dell' ordine dei lavori.
+E' stata distribuita la versione definitiva del progetto di ordine del giorno, elaborata, ai sensi dell' articolo 110 del Regolamento, dalla Conferenza dei presidenti nella seduta di giovedì 13 gennaio. Non sono state proposte modifiche per lunedì e martedì.
+Mercoledì:
+Il gruppo PSE ha chiesto di iscrivere una dichiarazione della Commissione sui suoi obiettivi strategici per i prossimi cinque anni e sulla riforma amministrativa della Commissione.
+Desidero che l' onorevole Barn Crespo, autore della richiesta, intervenga per motivarla, ovviamente se lo desidera. Poi procederemo come di norma: sentiremo un oratore a favore e uno contro.
+
+Signora Presidente, l' idea che la Commissione Prodi presentasse il suo programma politico per tutta la legislatura proviene inizialmente da una proposta del gruppo del Partito del socialismo europeo, approvata all' unanimità dalla Conferenza dei Presidenti in settembre e anche accettata esplicitamente dal Presidente Prodi, che ha ribadito il suo impegno al riguardo durante il discorso di investitura.
+Si tratta di un impegno importante in quanto la Commissione è un organo che detiene il monopolio di iniziativa, conformemente ai Trattati, e di conseguenza delinea i tratti essenziali di quella che sarà l' attività politica e legislativa di questo Parlamento nei prossimi cinque anni. Ricordo altresì, signora Presidente, che durante la precedente legislatura il Parlamento ha votato due volte la fiducia a favore del Presidente Prodi; durante l' attuale legislatura l' ha votata di nuovo a luglio e poi, dopo l' insediamento della nuova Commissione, ha votato nuovamente la fiducia per l' intera Commissione in settembre. Quindi c' è già stato tempo a sufficienza per permettere alla Commissione di elaborare il suo programma e per consentirci di prenderne conoscenza per poi spiegarlo ai cittadini. A tale proposito ricordo la risoluzione del 15 settembre scorso, in cui si raccomandava di presentare la proposta il più rapidamente possibile.
+I fatti della settimana scorsa - scaturiti a latere della Conferenza dei Presidenti, sfruttata solo per corroborare e ratificare decisioni adottate al di fuori di essa - ci pongono di fronte a un dilemma: o la Commissione non è in grado di presentare questo programma (in tal caso, sarebbe opportuno che lo dicesse. A sentire il suo Presidente, è in grado di farlo. Dato che la Commissione è rappresentata dalla vicepresidente de Palacio, ritengo che prima di votare converrebbe sapere se la Commissione è sempre disposta a presentare il programma, conformemente agli accordi); oppure il Parlamento non è in grado di esaminare tale programma, come apparentemente sostengono alcuni. Secondo me, questa seconda ipotesi significherebbe rinunciare alle nostre responsabilità di Parlamento, oltre a introdurre una tesi originale, un metodo finora sconosciuto che consiste nel distribuire per iscritto ai gruppi politici il discorso programmatico della Commissione una settimana prima - e non il giorno prima, come era stato concordato. Considerando che il programma legislativo sarà discusso a febbraio, potremmo prescindere dal dibattito, in quanto il giorno dopo la stampa ed Internet avrebbero divulgato il testo a tutti i cittadini e quindi il Parlamento non avrebbe più bisogno di occuparsene.
+Secondo il mio gruppo, un Parlamento serve per ascoltare, discutere e riflettere, quindi a nostro avviso non c' è alcuna ragione che giustifichi questo rinvio. Se la Commissione è in grado di presentare il programma, secondo noi siamo perfettamente in tempo per ripristinare l' accordo iniziale intervenuto tra il Parlamento e la Commissione e comportarci responsabilmente dinnanzi ai nostri concittadini. Perciò la proposta del gruppo del Partito del socialismo europeo, da lei menzionata, è che mercoledì si mantenga la presentazione del programma per la legislatura della Commissione Prodi, inserendovi anche il progetto di riforma amministrativa. Altrimenti potremmo ritrovarci in una situazione paradossale: con la scusa che non c' è il testo, si nega da un lato il diritto del Presidente della Commissione di rivolgersi a questo Parlamento, e dall' altro che abbia luogo una discussione sulla riforma, senza che il Parlamento conosca a priori i testi su cui si basa. Pertanto, signora Presidente, la prego di chiedere alla Commissione di esprimersi subito e poi di procedere al voto.
+(Applausi dai banchi del gruppo del partito del socialismo europeo)
+
+Signora Presidente, onorevoli colleghi, sono piuttosto sorpreso del comportamento del collega, onorevole Barón Crespo, che ora pretende che il punto in questione venga inserito nell'ordine del giorno di mercoledì.
+Onorevole collega Barón Crespo, lei non ha potuto partecipare giovedì scorso alla Conferenza dei presidenti. Non la biasimo per questo: può sempre succedere che si debba essere sostituiti. Il collega Hänsch è intervenuto in sua vece. In sede di Conferenza dei presidenti ne abbiamo discusso approfonditamente. Soltanto un gruppo politico condivideva l'opinione da lei espressa in questa sede. La questione è stata posta ai voti. Come è noto, ciascun presidente dispone di un numero di voti pari al numero dei deputati iscritti al proprio gruppo politico. Il punto in questione è stato oggetto di una votazione in cui, se ben ricordo, vi sono stati 422 voti contrari e 180 a favore con poche astensioni. Ciò significa che tutti i gruppi politici, ad eccezione dei non iscritti - che però non costituiscono un gruppo politico -, erano concordi e che un solo gruppo era del parere di procedere come proposto dal collega in questa sede. Tutti gli altri erano di diversa opinione e così è stato deciso.
+Vorrei ora entrare brevemente nel merito. Abbiamo fiducia nella Commissione, in Romano Prodi e la grande maggioranza del nostro gruppo politico, come tutti sanno, dopo un difficile processo ha votato la fiducia a Romano Prodi e alla Commissione. Tuttavia siamo anche dell'idea che la strategia della Commissione vada discussa nel corso di una procedura regolare, non soltanto in base a una dichiarazione rilasciata oralmente in questo Parlamento ma anche in base a un documento adottato dalla Commissione che illustri tale programma per i prossimi cinque anni. Ma un tale documento non esiste ancora!
+
+La Commissione presenterà il programma per il 2000 in febbraio. Abbiamo acconsentito: se la Commissione non vuole discutere il programma 2000 in gennaio lo faremo in febbraio. Non è certo nostra intenzione entrare in conflitto con la Commissione. Al contrario, pensiamo che per quanto possibile la Commissione e il Parlamento debbano percorrere una strada comune. Il Parlamento, tuttavia, esercita anche funzioni di controllo nei confronti della Commissione e non tutto ciò che viene proposto da quest'ultima deve necessariamente trovarci concordi.
+Vorrei che all'interno dei gruppi politici potessimo prepararci adeguatamente al dibattito sul programma quinquennale. Non è possibile farlo ascoltando una dichiarazione di cui non conosciamo con esattezza il contenuto. Perciò raccomandiamo - e ho l'impressione che anche la Commissione sia disposta ad accogliere questa idea - di discutere in febbraio il programma a lungo termine della Commissione che si estende fino al 2005 - sperando che a quel punto la Commissione abbia concordato un programma che ci sottoporrà - e, sempre in febbraio, anche il programma legislativo della Commissione per l'anno 2000. E' dunque sulla base di un nesso oggettivo che proponiamo di discutere contestualmente i due programmi e per questa ragione il mio gruppo politico respinge decisamente la proposta del gruppo socialista!
+(Applausi dai banchi del gruppo del PPE-DE)
+
+Signora Presidente, desidero affermare chiaramente che, innanzi tutto, la Commissione nutre il massimo rispetto per le decisioni del Parlamento tra cui quella di elaborare il proprio ordine del giorno. Quindi, noi rispettiamo le eventuali decisioni in materia del Parlamento.
+Ma voglio dire altrettanto chiaramente che il Presidente Prodi si è impegnato con il Parlamento a inserire un nuovo dibattito, come ha ricordato l' onorevole Barón, oltre al dibattito annuale sul programma legislativo della Commissione, sulle grandi linee di azione per il prossimo quinquennio, cioè per la presente legislatura.
+Tengo a sottolineare, signora Presidente, che, secondo l' accordo concluso nel settembre scorso, questo dibattito era distinto dalla presentazione del programma legislativo della Commissione. E desidero far sapere che, per quanto riguarda la Commissione, siamo pronti e disposti a tenere questo dibattito quando lo si ritenga opportuno; eravamo già pronti a farlo questa settimana, conformemente all' accordo iniziale, sulla base dell' intesa di una presentazione del discorso ai gruppi parlamentari il giorno prima.
+Quindi, signora Presidente, ribadisco che da parte nostra abbiamo discusso del programma di azione per il prossimo quinquennio e che siamo pronti a presentarlo quando vuole il Parlamento - anche questa settimana, se decide il tal senso- mentre il mese prossimo toccherà al programma per il 2000, esattamente come era stato stabilito.
+
+Propongo di porre in votazione la richiesta del gruppo PSE di iscrivere nuovamente all' ordine del giorno la dichiarazione della Commissione sui suoi obiettivi strategici.
+(Il Parlamento respinge la richiesta)
+Presidente. Sempre sulla giornata di mercoledì ho ricevuto un' altra proposta di modifica relativa alla interrogazione orale sull' imposta patrimoniale che il gruppo PPE-DE chiede di ritirare dall' ordine del giorno.
+Qualcuno desidera intervenire a nome del gruppo per motivare tale richiesta?
+
+Signora Presidente, sento qualche risata fra i socialisti. Mi è stato detto che anche una parte cospicua del gruppo socialista vorrebbe che questo punto venisse ritirato dall'ordine del giorno, in quanto nella votazione in sede di Conferenza dei presidenti è mancato il voto del gruppo di lavoro dei colleghi competenti del gruppo socialista. Non so se questa informazione sia corretta, ma noi del PPE-DE saremmo comunque grati se il suddetto punto venisse eliminato visto che il Parlamento si è già occupato ripetutamente della questione. Esistono anche alcune decisioni contro tale imposta. Per questa ragione il gruppo del PPE-DE chiede che il punto in questione venga ritirato dall'ordine del giorno.
+
+La ringrazio, onorevole Poettering.
+Ha facoltà l' onorevole Wurtz che interviene contro la richiesta.
+
+Signora Presidente, vorrei innanzi tutto sottolineare la mancanza di logica da parte dell' onorevole Poettering che ha appena fatto la morale al gruppo socialista per essere tornato su una decisione approvata dalla Conferenza dei presidenti con una netta maggioranza. Ebbene, egli ha fatto la stessa cosa. Si era discusso e tutti si erano detti d' accordo, tranne il gruppo PPE-DE e il gruppo ELDR. In tale circostanza - gli onorevoli colleghi presidenti lo ricorderanno - avevo altresì sottolineato che il punto non era tanto sapere se siamo a favore o contro la tassa Tobin, ma se abbiamo il coraggio di ascoltare che cosa ne pensano la Commissione e il Consiglio. Non è chiedere molto. Pertanto, reitero la proposta di mantenere all' ordine del giorno l' interrogazione orale al Consiglio e alla Commissione, per apprendere, una volta per tutte, la posizione delle due Istituzioni su una proposta relativamente modesta, ma che lancerebbe un segnale importante all' opinione pubblica, soprattutto sull' onda dell' emozione suscitata dal fallimento della Conferenza di Seattle.
+
+Pongo ora in votazione la richiesta del gruppo PPE-DE intesa a ritirare dall' ordine del giorno l' interrogazione orale sull' imposta patrimoniale.
+(Il Parlamento respinge la richiesta con 164 voti favorevoli, 166 contrari e 7 astenuti)
+
+Signora Presidente, ringrazio l' onorevole Poettering per l' inaspettata pubblicità che ha appena dato a questa discussione. Grazie!
+
+Signora Presidente, è stato contato il mio voto, che non è stato deposto elettronicamente, perché non ho la scheda? Il mio voto era favorevole.
+
+In effetti, se aggiungiamo i voti dei due colleghi che sono intervenuti, il risultato...
+
+Signora Presidente, la Presidenza ha già annunciato l' esito della votazione. Non sono ammesse modifiche.
+
+Onorevoli colleghi, ancora una volta, occorre presentarsi in Aula con la carta di votazione anche il lunedì. Evidentemente abbiamo un problema sul quale sono chiamata a prendere una decisione.
+Anch' io ho dimenticato la mia carta di votazione e avrei votato contro. Ritengo pertanto che si debba concludere che l' interrogazione orale rimane iscritta all' ordine del giorno.
+
+Questa è l' ultima volta che si terrà conto del voto dei deputati che hanno dimenticato la loro carta di votazione. Che sia ben chiaro per tutti.
+(Applausi)
+Sì, l' interrogazione orale resta all' ordine del giorno ed ebbene sì, la Presidente ha diritto di votare così come ha diritto anche di dimenticare la carta di votazione.
+Proseguiamo con le altre modifiche all' ordine del giorno.
+
+Signora Presidente, premetto che rispetterò la sua decisione, ma durante la votazione precedente sulla questione del piano strategico della Commissione avevo manifestato l'intenzione di intervenire a nome del mio gruppo prima della votazione, ma non ne ho avuto la possibilità. Le sarei molto grato se prima di chiudere questo punto all'ordine del giorno mi permettesse di rilasciare una dichiarazione di voto a nome del mio gruppo. Si tratta di una cosa importante e sarebbe utile poter mettere a verbale il motivo del nostro comportamento al momento della votazione alla luce della nostra analisi politica.
+
+Signora Presidente, non è mia intenzione riprendere la discussione, ma anch'io avevo chiesto di intervenire per prendere posizione sulla richiesta dell'onorevole Barón Crespo. Lei non mi ha dato la parola. Ne sono spiacente anche se ormai la votazione è già stata effettuata, la decisione presa e quindi la questione è da considerarsi chiusa.
+
+Me ne dispiace, onorevoli Hnsch e Cox, non mi ero accorta che avevate chiesto la parola. Comunque mi pare che le posizioni siano chiare e saranno riportate al processo verbale. Quando domani approveremo il processo verbale della seduta odierna i colleghi che dovessero ritenerlo inadeguato potranno chiedere che esso venga modificato. Mi pare una buona soluzione. Evidentemente il processo verbale della seduta di domani riporterà tutte le eventuali dichiarazioni complementari. Mi pare una formula migliore piuttosto che procedere ora alle dichiarazioni di voto che ci porterebbero molto lontano. Onorevole Cox, onorevole Hnsch, siete d' accordo?
+
+Signora Presidente, se il verbale rispecchierà correttamente il voto del mio gruppo non avrò alcuna obiezione. Ma se la sua decisione implica che non posso rilasciare una dichiarazione di voto, la accetto con delle riserve.
+
+Faremo molta attenzione allora alla redazione del processo verbale, come per altro facciamo sempre. Se esso non rifletterà correttamente le posizioni potrà essere modificato.
+(Il Parlamento approva l' ordine del giorno così modificato)
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/pt.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/pt.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/pt.test (revision 0)
@@ -0,0 +1,105 @@
+Reinício da sessão
+Declaro reaberta a sessão do Parlamento Europeu, que tinha sido interrompida na sexta-feira, 17 de Dezembro último, e renovo todos os meus votos, esperando que tenham tido boas férias.
+Como puderam constatar, o grande "bug do ano 2000" não aconteceu. Em contrapartida, os cidadãos de alguns dos nossos países foram vítimas de catástrofes naturais verdadeiramente terríveis. Os senhores manifestaram o desejo de se proceder a um debate sobre o assunto nos próximos dias, durante este período de sessões. Entretanto, gostaria - como também me foi pedido por um certo número de colegas - que observássemos um minuto de silêncio por todas as vítimas, nomeadamente das tempestades, nos diferentes países da União Europeia que foram afectados. Convido-os a levantarem-se para um minuto de silêncio.
+(O Parlamento, de pé, guarda um minuto de silêncio)
+
+Senhora Presidente, intervenho para um ponto de ordem. Certamente que já tomou conhecimento, pelas notícias transmitidas na imprensa e na televisão, dos diversos atentados à bomba e assassínios perpetrados no Sri Lanka. Uma das pessoas recentemente assassinadas foi o senhor Kumar Ponnambalam, que ainda há poucos meses visitara o Parlamento Europeu. Será que a senhora Presidente poderia enviar uma carta à Presidente do Sri Lanka manifestando o pesar do Parlamento por esta e outras mortes violentas perpetradas no seu país, e instandoa a envidar todos os esforços ao seu alcance para procurar obter uma reconciliação pacífica na situação extremamente difícil que ali se vive?
+
+Sim, Senhor Deputado Evans, penso que uma iniciativa no sentido que acaba de sugerir seria perfeitamente adequada. Se a assembleia estiver de acordo, farei como sugeriu o senhor deputado Evans.
+
+Senhora Presidente, intervenho para um ponto de ordem. Nos termos do artigo 143º do Regimento, gostaria que me desse o seu parecer em relação à inadmissibilidade de uma proposta. A questão que pretendo focar incide sobre um relatório que será aqui tratado na quintafeira, ocasião em que tenciono levantála novamente.
+O relatório Cunha sobre os resultados dos programas de orientação plurianuais para as frotas de pesca, inscrito na ordem do dia de quintafeira, contém, no seu nº 6, uma proposta no sentido da aplicação de sanções, sob a forma de uma redução automática das quotas, aos EstadosMembros que não cumpram anualmente os objectivos de redução da respectiva frota definidos nos programas de orientação plurianuais. Mais se propõe que a aplicação das sanções seja feita independentemente da salvaguarda do princípio da estabilidade relativa. O princípio da estabilidade relativa constitui, em minha opinião, um princípio jurídico fundamental da política comum da pesca, pelo que toda e qualquer proposta que vise subvertêlo é, com certeza, juridicamente inadmissível. Gostaria de saber se posso levantar uma objecção deste tipo ao que constitui meramente um relatório, não uma proposta legislativa, e se tenho competência para o fazer na quintafeira.
+
+Com efeito, é precisamente nessa altura que, se o desejar, poderá levantar a questão, isto é, na quinta-feira antes do início da apresentação do relatório.
+
+Senhora Presidente, coincidindo com a primeira sessão deste ano do Parlamento Europeu, nos Estados Unidos, no Texas, está marcada, lamentavelmente para a próxima quinta-feira, a execução de um condenado à morte, um jovem de 34 anos a quem designaremos por X.
+A pedido de um deputado francês, o senhor deputado Zimeray, já foi apresentada uma petição, que teve muitos signatários, entre os quais o abaixo assinado, mas peçolhe, em conformidade com a orientação repetidamente expressa pelo Parlamento Europeu e por toda a Comunidade Europeia, que intervenha, com o prestígio do seu cargo e da Instituição que representa, junto do Presidente e do Governador do Texas, Bush, que tem poder para suspender a condenação à morte e perdoar o condenado.
+E tudo isso em conformidade com os princípios que sempre defendemos.
+
+Obrigada, Senhor Deputado Segni, fá-lo-ei de boa vontade. Com efeito, essa é a linha das posições que o nosso Parlamento sempre adoptou.
+
+Senhora Presidente, gostaria de chamar a sua atenção para um caso de que este Parlamento repetidamente se tem ocupado. É o caso de Alexander Nikitin. Congratulamo-nos todos aqui pelo facto de o tribunal o ter posto em liberdade e ter tornado claro que também na Rússia o acesso às informações sobre o ambiente constitui direito constitucional. No entanto, sucede agora que ele deverá será novamente acusado, uma vez que o Ministério Público irá interpor recurso. Sabemos e constatámolo realmente em muitíssimas resoluções - precisamente durante a última sessão plenária do ano passado - que aqui não se trata apenas de um caso jurídico e que é errado acusar Alexander Nikitin de crime e de traição, uma vez que nós, que somos afectados, podemos tirar proveito dos resultados por ele conseguidos. Estes resultados constituem a base do Programa Europeu de Defesa do Mar de Barents e, por esse motivo, peço-lhe que analise um projecto de carta que lhe expõe os factos mais importantes, e que, de acordo com as decisões do Parlamento, torne clara esta posição na Rússia.
+
+Sim, Senhora Deputada Schroedter, analisarei de boa vontade os factos relativos a essa questão, logo que receba a sua carta.
+
+ (NL) Senhora Presidente, em primeiro lugar, gostaria de a felicitar pelo facto de ter cumprido a sua palavra e de agora, neste primeiro período de sessões do novo ano, ter aumentado realmente muito o número de canais de televisão nos nossos gabinetes. Todavia, Senhora Presidente, não se fez aquilo que eu tinha pedido. É certo que há agora dois canais finlandeses e um português, mas continua a não haver um único canal holandês, como eu lhe tinha pedido, porque também os holandeses gostam de ver os noticiários, todos os meses, quando somos mandados para aqui, para este desterro. Queria, portanto, pedirlhe, uma vez mais, que tome a seu cargo fazer com que também recebamos um canal holandês.
+
+Senhora Deputada Plooij-van Gorsel, posso dizer-lhe que essa questão se encontra inscrita na ordem de trabalhos da reunião dos Questores de quartafeira. Será analisada, espero, num espírito construtivo.
+
+Senhora Presidente, podermeá dizer por que razão este Parlamento não respeita a legislação por si próprio aprovada em matéria de segurança e higiene? Por que razão não foi efectuado neste edifício onde nos encontramos qualquer ensaio sobre a qualidade do ar desde que fomos eleitos? Por que razão o nosso Comité da Segurança e Higiene não se reúne desde 1998? Porque não foi efectuado qualquer exercício de simulação de incêndio nos edifícios do Parlamento, quer em Bruxelas quer em Estrasburgo? Porque não se encontram afixadas instruções a seguir em caso de incêndio? Por que razão as escadas não foram melhoradas desde o meu acidente? Porque não são criadas zonas obrigatórias de não fumadores? Considero absolutamente vergonhoso o facto de não respeitarmos a legislação que nós próprios aprovámos.
+
+Senhora Deputada Lynne, tem toda a razão. Vou verificar se nada disso foi efectivamente feito. Submeterei também o problema ao Colégio dos Questores e estou certa de que os nossos Questores levarão a peito fazer com que respeitemos a regulamentação que, com efeito, aprovamos.
+
+ (ES) Senhora Presidente, a senhora deputada Díez González e eu próprio tínhamos apresentado algumas perguntas a respeito de certas opiniões da senhora Vice-presidente, senhora Comissária de Palacio, que tinham sido reproduzidas num jornal espanhol. Os serviços competentes não as incluíram na ordem do dia, por considerarem que já lhes tinha sido dada resposta numa sessão anterior.
+Rogo-lhe que reconsidere esta decisão, porque as coisas não se passaram assim. As perguntas a que tinha sido dada resposta anteriormente referiam-se à intervenção da senhora Comissária de Palacio em determinado dossier e não a essas declarações aparecidas no jornal ABC, no dia 18 do passado mês de Novembro.
+
+Cara colega, vamos verificar tudo isso. Confesso que, para já, as coisas me parecem um pouco confusas. Assim, vamos rever essa questão muito seriamente, para que tudo fique em ordem.
+
+Senhora Presidente, gostaria de saber se esta semana o Parlamento terá oportunidade de manifestar a sua inequívoca posição de descontentamento face à decisão, hoje tomada, de não renovar o embargo de armas destinadas à Indonésia, tendo em atenção que a grande maioria da assembleia apoiou o referido embargo quando este foi decretado. Perante a situação que se vive naquela região, a decisão hoje tomada de não renovar o embargo de armas é extremamente perigosa. O Parlamento deveria, pois, enviar um sinal inequívoco do seu descontentamento face à suspensão do embargo, uma vez que é essa a posição da grande maioria da assembleia. A recusa por parte dos EstadosMembros da União Europeia de renovar o embargo de armas destinadas à Indonésia é uma atitude irresponsável. Como já aqui foi afirmado, a situação que ali se vive é extremamente volátil. Existe, aliás, o risco de poder haver um golpe militar no futuro. Não sabemos exactamente o que ali se está a passar. Como é possível a UE permitir que os fabricantes europeus de armamentos obtenham lucros à custa das vidas de seres humanos inocentes?
+
+Seja como for, essa questão não figura, para já, entre os pedidos de aplicação do processo de urgência para a próxima quinta-feira.
+
+Ordem dos trabalhos
+Segue-se na ordem do dia a fixação da ordem de trabalhos. Foi distribuída a versão final do projecto de ordem do dia do presente período de sessões, elaborada pela Conferência dos Presidentes, reunida na quinta-feira, 13 de Janeiro, nos termos do artigo 110º do Regimento. Relativamente a segunda e terça-feiras, não foram apresentados pedidos de modificação.
+Quarta-feira:
+O Grupo do Partido dos Socialistas Europeus pede a inclusão de uma declaração da Comissão sobre os seus objectivos estratégicos para os próximos cinco anos, bem com o sobre a reforma administrativa da Comissão.
+Gostaria que o senhor deputado Barón Crespo, autor do pedido, interviesse para o justificar, caso pretenda, evidentemente. Em seguida, faremos como é costume: ouviremos um orador a favor e um orador contra.
+
+ (ES) Senhora Presidente, a apresentação do programa político da Comissão Prodi para toda a legislatura foi inicialmente uma proposta do Grupo do Partido dos Socialistas Europeus, que, em Setembro, conseguiu a unanimidade na Conferência dos Presidentes, bem como a aceitação explícita do Presidente da Comissão, Romano Prodi, que reiterou o seu compromisso no seu discurso de investidura.
+Este compromisso é importante na medida em que a Comissão é um organismo que, de acordo com os Tratados, detém o monopólio da iniciativa e que, portanto, determina fundamentalmente o que vai ser a actividade política e legislativa deste Parlamento nos próximos cinco anos. Recordo, além disso, Senhora Presidente, que, na anterior legislatura, este Parlamento deu, em duas ocasiões diferentes, o seu voto de confiança ao Presidente da Comissão, Romano Prodi, coisa que voltou a fazer em Julho, nesta legislatura. Mais tarde, já com a nova Comissão em funcionamento, voltou a dar um voto de confiança a toda a Comissão em Setembro. Já houve, portanto, tempo suficiente para a Comissão preparar o seu programa e para nós podermos tomar conhecimento dele e explanálo aos cidadãos. Neste sentido, recordo a resolução de 15 de Setembro, em que se recomendava a apresentação da proposta dentro do mais breve prazo possível.
+Os factos ocorridos na semana passada - que tiveram origem à margem da Conferência dos Presidentes, e que a utilizaram só para corroborar e ratificar decisões tomadas fora dela - criam um dilema: ou a Comissão não se encontra em condições de apresentar esse programa (e nesse caso conviria que o explicasse. Segundo as palavras da sua Presidente, porém, encontrase em condições de o fazer e dado que a Comissão se encontra representada pela Vicepresidente, senhora Comissária de Palacio, creio que antes de se proceder à votação seria conveniente conhecer a situação da Comissão relativamente à sua disponibilidade para apresentar o programa, tal como tinha sido acordado), ou então o Parlamento não se encontra em condições de examinar este programa como, aparentemente, alguns pretendem. Em minha opinião, esta segunda hipótese significaria o abandono das nossas responsabilidades como Parlamento, além de introduzir uma tese original, um método desconhecido que consiste em dar a conhecer por escrito aos grupos políticos o discurso pragmático da Comissão com uma semana de antecedência - e não no dia anterior, como se tinha acordado -, tendo em conta o facto de o programa legislativo ir ser discutido em Fevereiro, de modo que poderíamos prescindir do debate, porque no dia seguinte a imprensa e a Internet já o teriam dado a conhecer a todos os cidadãos, não tendo já o Parlamento motivo para se ocupar do assunto.
+Como o meu grupo é de opinião que um Parlamento foi feito para escutar, para debater e para reflectir, pensamos não haver motivo algum que justifique este adiamento. Cremos, além disso, que sim, que a Comissão se encontra em condições de o fazer, que estamos perfeitamente a tempo de poder restabelecer o acordo original entre o Parlamento e a Comissão e de proceder responsavelmente perante as nossas concidadãs e os nossos concidadãos. Logo, a proposta do Grupo do Partido dos Socialistas Europeus que a senhora mencionou é que se mantenha a apresentação na quartafeira do programa da legislatura da Comissão Prodi, incluindo neste programa também o projecto de reforma administrativa, porque, de outro modo, podemos vir a encontrarnos numa situação paradoxal: com a desculpa de não existir texto, negase, por um lado, ao Presidente da Comissão o direito de fazer uso da palavra neste Parlamento, e, por outro lado, a possibilidade de realização de um debate sobre a reforma sem que este Parlamento conheça previamente os textos em que se baseia. Rogolhe, portanto, Senhora Presidente, que peça à Comissão que se manifeste agora e que depois se proceda à votação.
+(Aplausos da bancada do Grupo PSE)
+
+Senhora Presidente, caros colegas, estou realmente um pouco estupefacto em relação à atitude do colega Barón Crespo, que exige agora que este ponto da ordem do dia seja inscrito na ordem do dia de quarta-feira.
+Senhor Deputado Barón Crespo, o senhor não pôde comparecer na passada quinta-feira à Conferência dos Presidentes. Não o critico por isso; de vez em quando acontece enviarmos um representante. O colega Hänsch representou-o nessa ocasião. Realizámos um exaustivo debate na Conferência dos Presidentes. Apenas o seu grupo defendeu a posição que o senhor agora defende. Procedemos seguidamente à votação. Cada presidente tem tantos votos quantos os membros do seu grupo. Teve lugar uma votação em relação a este ponto. Se bem me recordo, a votação teve o seguinte resultado: 422 votos contra 180 e umas poucas abstenções. Ou seja, todos os grupos, com a excepção dos Não-inscritos - mas esses nem sequer constituem grupo - chegaram a consenso; apenas o seu grupo defendia que se procedesse do modo que aqui propôs. Todos os restantes discordavam. Foi essa a decisão.
+Agora gostaria de dizer algo a respeito da matéria de fundo desta questão. Confiamos na Comissão, em Romano Prodi e a esmagadora maioria do nosso grupo depositou, como todos sabemos, a sua confiança em Romano Prodi e na Comissão, na sequência de um difícil processo. No entanto, somos também da opinião de que deveria haver um debate sobre esta estratégia da Comissão que seguisse um procedimento ordenado, e não só com base numa declaração oral pronunciada aqui no Parlamento Europeu, mas também com base num documento que seja decidido na Comissão e que apresente uma descrição deste programa para um período de cinco anos. Esse documento não existe!
+
+A Comissão irá apresentar em Fevereiro o programa para o ano 2000. Nós demos o nosso acordo, se a Comissão não quiser ainda elaborar o Programa para 2000 em Janeiro, então que o faça em Fevereiro. Votámos a favor. Não pretendemos entrar em conflito com a Comissão só por entrar, mas somos da opinião de que, se for possível, a Comissão e o Parlamento devem seguir um mesmo caminho. Todavia, enquanto Parlamento, somos também o órgão controlador da Comissão e nem tudo o que provém da Comissão tem de coincidir com a nossa opinião.
+Gostaria que nos pudéssemos preparar seriamente nos diferentes grupos para um debate sobre o programa para os próximos cinco anos. Não é possível prepararmo-nos se ouvirmos aqui falar de uma declaração e não soubermos qual o conteúdo dessa mesma declaração. Por esse motivo, sugerimos - e a minha impressão é que a Comissão também está aberta a estas considerações - que se agende para Fevereiro o debate sobre o programa a longo prazo da Comissão até ao ano 2005. Espero que a Comissão chegue a acordo, até essa data, relativamente a um programa que nos venha a propor, e sugerimos que, também em Fevereiro, realizemos o debate sobre o programa legislativo da Comissão para o ano 2000. É, portanto, também um contexto objectivo sério que nos aconselha a realizar conjuntamente o debate sobre os dois programas. Por isso, o meu grupo rejeita decididamente a proposta do Grupo do Partido dos Socialistas Europeus!
+(Aplausos do Grupo PPE-DE)
+
+Senhora Presidente, quero deixar bem claro que, acima de tudo, a Comissão tem o máximo respeito pelas decisões deste Parlamento e, entre elas, a de estabelecer a sua ordem do dia. Respeitamos, portanto, o que este Parlamento possa decidir nesse sentido.
+Quero, porém, deixar igualmente bem claro que o Presidente da Comissão, Romano Prodi, se comprometeu com o Parlamento a acrescentar um novo debate, como recordou o senhor deputado Barón Crespo, ao debate anual sobre o programa legislativo da Comissão, sobre as grandes linhas de actuação para o próximo período de cinco anos, quer dizer, para esta legislatura.
+Quero dizer, Senhora Presidente, que, no acordo a que se chegou no mês de Setembro, este debate se distinguia daquilo que constitui a apresentação anual do programa legislativo da Comissão. Quero dizer também, Senhora Presidente, que, por parte da Comissão, estamos preparados e dispostos a realizar esse debate quando for conveniente, que estávamos preparados para o realizar esta semana, como se tinha acordado inicialmente, partindo da base de que o programa seria apresentado na véspera, num discurso aos grupos parlamentares.
+Quero, portanto, Senhora Presidente, reiterar que, pela nossa parte, já discutimos o programa de actuação para os próximos cinco anos e que estamos preparados para, quando o Parlamento decidir - esta mesma semana, se for essa a sua decisão - vir expor aqui o programa para os próximos cinco anos, e, no mês que vem, o programa para o ano 2000, que era o que estava absolutamente combinado.
+
+Proponho que votemos o pedido do Grupo do Partido dos Socialistas Europeus que visa voltar a inscrever a declaração da Comissão sobre os seus objectivos estratégicos.
+(O Parlamento rejeita o pedido) Presidente. Ainda no que respeita ao dia de quartafeira, recebi uma outra proposta referente à pergunta oral relativa ao imposto sobre o capital. O Grupo do Partido Popular Europeu/Democratas Europeus pede que esse ponto seja retirado da ordem do dia.
+Algum colega pretende tomar a palavra em nome do grupo e justificar esse pedido?
+
+Senhora Presidente, estou a ouvir alguns risos da bancada do Grupo do Partido dos Socialistas Europeus, mas foi-me dito que também largos círculos do Grupo do Partido dos Socialistas Europeus teriam gostado de retirar este ponto da ordem do dia, visto que aquando da votação na Conferência dos Presidentes, o parecer do grupo de trabalho das colegas e dos colegas competentes do Grupo do Partido dos Socialistas Europeus não foi apresentado. Não sei se esta informação é correcta, mas nós, Grupo PPEDE, ficaríamos, em todo o caso, gratos se este ponto fosse retirado, uma vez que o Parlamento já se debruçou sobre esta questão várias vezes. Existem também decisões contra um imposto deste tipo. Por esse motivo, o meu grupo vem requerer a supressão deste ponto da ordem do dia.
+
+Obrigada, Senhor Deputado Poettering.
+Dou a palavra ao senhor deputado Wurtz, que intervirá contra este pedido.
+
+Senhora Presidente, antes de mais, gostaria de realçar a ausência de lógica do senhor deputado Poettering. Há pouco, pregou um sermão ao Grupo do Partido dos Socialistas Europeus porque este volta atrás numa decisão tomada muito claramente na Conferência dos Presidentes. Agora, faz a mesma coisa. Nós discutimos, fomos unânimes - à excepção do Grupo do Partido Popular Europeu/Democratas Europeus e do Grupo do Partido Europeu dos Liberais, Democratas e Reformistas - e eu cheguei mesmo a observar, como se recordarão, caros confrades presidentes, que a questão não é a de saber se estamos a favor ou contra a taxa de Todin, mas sim a de saber se ousamos ouvir o que a Comissão e o Conselho pensam dela. Não é pedir muito. Assim, reitero a proposta de se manter essa pergunta oral à Comissão e ao Conselho, a fim de conhecermos, de uma vez por todas, a posição daquelas duas instâncias perante esta proposta, relativamente modesta, mas que emitiria um sinal importante dirigido à opinião pública, sobretudo depois da emoção criada em torno do fracasso da Conferência de Seattle.
+
+Coloco à votação o pedido do Grupo do Partido Popular Europeu/Democratas Europeus, que visa retirar da ordem do dia a pergunta oral relativa ao imposto sobre o capital.
+(O Parlamento rejeita o pedido, com 164 votos a favor, 166 votos contra e 7 abstenções)
+
+Senhora Presidente, gostaria de agradecer ao senhor deputado Poettering a publicidade que acaba de dar a este debate. Obrigado.
+
+ (ES) Senhora Presidente, será que se contou o meu voto, que não pôde ser efectuado electronicamente, pelo facto de eu não ter o cartão? O meu voto era "a favor".
+
+Efectivamente, se juntarmos os dois colegas que se manifestaram, obteremos como resultado...
+
+ (ES) Senhora Presidente, a Presidência anunciou o resultado da votação. Não há lugar para mudanças.
+
+Caros colegas, mais uma vez, temos todos de trazer o cartão à segunda-feira. Estamos perante um problema. Por conseguinte, tenho de tomar uma decisão.
+Também eu me esqueci do meu cartão, e teria votado contra. Assim, considero que a pergunta oral se mantém inscrita na ordem do dia
+É a última vezes que contaremos os cartões esquecidos. Que fique bem claro e que se informe toda a gente.
+(Aplausos)Sim, a pergunta oral mantém-se na ordem do dia, e sim, a presidente tem o direito de votar, como também tem o direito de se esquecer do cartão.
+Vamos prosseguir com as outras modificações da ordem de trabalhos.
+
+Senhora Presidente, na votação anterior - e aceitarei a sua decisão nesta matéria - sobre a questão dos objectivos estratégicos da Comissão, informei que gostaria de, em nome do Grupo ELDR, usar da palavra antes da votação. Tal não se verificou. Solicitarlheia, pois, que, antes de passarmos ao próximo ponto da ordem do dia, me fosse permitido fazer uma declaração de voto em nome do meu grupo. Tratase de uma questão importante. Seria vantajoso para a reputação deste Parlamento declarar de que modo as pessoas interpretam o que acabamos de fazer à luz da sua própria análise política.
+
+Senhora Presidente, não pretendo relançar o debate, mas tinha também pedido a palavra para me pronunciar sobre o pedido do senhor deputado Barón Crespo. Também não me chamou. Lamento-o, mas já se procedeu à votação, a decisão foi tomada, portanto, esqueçamos o assunto.
+
+Peço muita desculpa, Senhor Deputado Hänsch e Senhor Deputado Cox, mas não vi que estavam a pedir a palavra. Dito isto, penso que as posições estão muito claras e que serão correctamente reproduzidas na acta. Quando amanhã aprovarmos a acta da sessão de hoje, os colegas que considerarem que as posições não foram suficientemente bem explicadas, podem pedir modificações. Penso que se trata de uma boa solução. Evidentemente que a acta da reunião de amanhã terá em conta todas as explicações suplementares. Creio ser uma solução melhor do que proceder agora a declarações de voto que nos levariam muito longe. Senhor Deputado Cox, Senhor Deputado Hänsch, estão de acordo?
+
+Senhora Presidente, se o resultado da votação reflectir correctamente o sentido de voto do meu grupo, não me posso opor ao mesmo, nem o farei. Se a sua decisão for no sentido de eu não poder fazer uma declaração de voto, terei de a aceitar, mas com reservas.
+
+Prestaremos portanto muita atenção à redacção da acta. Aliás, prestamos sempre. Se não reflectir bem as nossas posições, podemos sempre corrigi-la.
+(O Parlamento aprova a ordem de trabalhos assim modificada)
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/da.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/da.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/da.test (revision 0)
@@ -0,0 +1,108 @@
+Genoptagelse af sessionen
+Jeg erklærer Europa-Parlamentets session, der blev afbrudt fredag den 17. december, for genoptaget. Endnu en gang vil jeg ønske Dem godt nytår, og jeg håber, De har haft en god ferie.
+Som De kan se, indfandt det store "år 2000-problem" sig ikke. Til gengæld har borgerne i en del af medlemslandene været ramt af meget forfærdelige naturkatastrofer. De har udtrykt ønske om en debat om dette emne i løbet af mødeperioden. I mellemtiden ønsker jeg - som også en del kolleger har anmodet om - at vi iagttager et minuts stilhed til minde om ofrene for bl.a. stormene i de medlemslande, der blev ramt. Jeg opfordrer Dem til stående at iagttage et minuts stilhed.
+(Parlamentet iagttog stående et minuts stilhed
+
+Fru formand, en bemærkning til forretningsordenen. Gennem pressen og tv vil De være bekendt med en række bombeeksplosioner og drab i Sri Lanka. En af de personer, der blev myrdet for ganske nylig i Sri Lanka, var hr. Kumar Ponnambalam, der besøgte Europa-Parlamentet for få måneder siden. Ville det være passende, hvis De, fru formand, sendte en skrivelse til Sri Lankas præsident for at udtrykke vores dybe beklagelse i forbindelse med Kumar Ponnambalams død og de andre voldsomme dødsfald i Sri Lanka og for indtrængende at anmode præsidenten om at gøre alt for at opnå en fredelig løsning på en meget vanskelig situation?
+
+Ja, hr. Evans, jeg mener, at et initiativ, som det, De foreslår, ville være meget hensigtsmæssigt. Hvis Europa-Parlamentet er enigt, vil jeg gøre, som hr. Evans har foreslået.
+
+Fru formand, en bemærkning til forretningsordenen. Jeg vil gerne have Deres råd om artikel 143 vedrørende afvisning. Mit spørgsmål omhandler et emne, der vil blive behandlet på torsdag, og jeg vil gerne tage emnet op igen ved den lejlighed.
+Betænkningen af Cunha om flerårige udviklingsprogrammer skal forhandles af Parlamentet på torsdag og indeholder et forslag i punkt 6 om, at der skal indføres kvotesanktioner for lande, der ikke overholder deres årlige målsætninger for flådereduktion. Dette skal i henhold til punkt 6 indføres til trods for princippet om relativ stabilitet. Jeg mener, at princippet om relativ stabilitet er et grundlæggende retsprincip for den fælles fiskeripolitik, og at der vil være juridisk belæg for at afvise et forslag om at undergrave dette princip. Jeg vil gerne vide, om man kan gøre indsigelse mod noget, der bare er en betænkning og ikke et forslag til retsakt, og om det er noget, jeg kan gøre på torsdag?
+
+Det er netop dér, De - hvis De ønsker det - kan rejse dette spørgsmål, det vil sige på torsdag ved forhandlingens begyndelse.
+
+Fru formand, samtidig med Europa-Parlamentets første mødeperiode i år har man i Texas i USA fastsat datoen for henrettelsen af en dødsdømt, nemlig en ung mand på 34 år ved navn Hicks, og det er desværre på næste torsdag.
+På anmodning af et fransk parlamentsmedlem, hr. Zimeray, er der allerede indgivet et andragende, som mange har skrevet under på, heriblandt undertegnede, men i tråd med den holdning, som Europa-Parlamentet og hele Det Europæiske Fællesskab konstant giver udtryk for, anmoder jeg Dem om at gøre den indflydelse, De har i kraft af Deres embede og den institution, De repræsenterer, gældende over for præsidenten og Texas' guvernør Bush, som har beføjelse til at ophæve dødsdommen og benåde den dømte.
+Alt dette er i tråd med de principper, vi altid har været tilhængere af.
+
+Tak, hr. Segni, det gør jeg med glæde. Det er således helt i tråd med den holdning, Europa-Parlamentet altid har indtaget.
+
+Fru formand, jeg vil gerne gøre Dem opmærksom på en sag, som Parlamentet har beskæftiget sig med gentagne gange. Det drejer sig om Alexander Nikitin. Vi glæder os alle sammen over, at domstolen har frifundet ham og understreget, at adgangen til miljøinformationer også er konstitutionel ret i Rusland. Men nu er det sådan, at han skal anklages igen, fordi statsadvokaten har anket dommen. Vi ved og har fastslået i virkelig mange beslutninger - netop på det sidste møde sidste år - at dette ikke bare er en juridisk sag, og at det er forkert at beskylde Alexander Nikitin for at have begået kriminalitet og forræderi, fordi vi som berørte nyder godt af hans resultater. Disse resultater er grundlaget for de europæiske programmer til beskyttelse af Barentsee, og derfor beder jeg Dem gennemgå et brevudkast, som beskriver de vigtigste fakta, og tydeliggøre denne holdning i Rusland i overensstemmelse med Parlamentets beslutninger.
+
+Ja, fru Schroedter, jeg skal med glæde undersøge dette spørgsmål, når jeg har modtaget Deres brev.
+
+Fru formand, jeg vil gerne først give Dem en kompliment for den kendsgerning, at De har holdt Deres ord, og at antallet af tv-kanaler på vores kontorer faktisk er udvidet enormt nu i denne første mødeperiode i det nye år. Men, fru formand, det, som jeg havde anmodet om, er ikke sket. Der er nu ganske vist to finske kanaler og en portugisisk kanal, men der er stadig ingen nederlandsk kanal, og jeg havde anmodet Dem om en nederlandsk kanal, fordi også nederlændere gerne vil følge med i nyhederne hver måned, når vi forvises til dette sted. Jeg vil således endnu en gang anmode Dem om alligevel at sørge for, at vi også får en nederlandsk kanal.
+
+Fru Plooij-van Gorsel, jeg kan oplyse Dem om, at dette spørgsmål er opført på dagsordenen for kvæstorernes møde på onsdag. Det vil, håber jeg, blive behandlet i en positiv ånd.
+
+Fru formand, kan De fortælle mig, hvorfor Parlamentet ikke overholder de lovgivningsbestemmelser om sundhed og sikkerhed, som det selv har fastsat? Hvorfor er der ikke foretaget en undersøgelse af luftkvaliteten i denne bygning, siden vi blev valgt? Hvorfor har Sundheds- og Sikkerhedsudvalget ikke haft et møde siden 1998? Hvorfor har der ikke været brandøvelser, hverken i parlamentsbygningerne i Bruxelles eller Strasbourg? Hvorfor er der ingen brandinstrukser? Hvorfor etableres der ikke områder med rygeforbud? Det er fuldstændig skandaløst, at vi fastsætter lovgivningsbestemmelser og så ikke overholder dem selv.
+
+Fru Lynne, De har fuldstændig ret, og jeg vil kontrollere, om alle disse ting virkelig ikke er blevet gjort. Jeg vil ligeledes fremlægge problemet for kvæstorerne, og jeg er sikker på, at kvæstorerne vil bestræbe sig på at sørge for, at vi overholder den lovgivning, vi vedtager.
+
+Fru formand, fru Díez González og jeg havde stillet nogle spørgsmål om visse holdninger gengivet i en spansk avis, som næstformanden, fru de Palacio, har givet udtryk for. De kompetente tjenestegrene har ikke opført dem på dagsordenen, fordi de mener, at de blev besvaret ved et tidligere møde.
+Jeg anmoder om, at denne beslutning tages op til fornyet overvejelse, for det er ikke tilfældet. De spørgsmål, der tidligere er blevet besvaret, drejede sig om fru de Palacios medvirken i en bestemt sag og ikke om de erklæringer, som kunne læses i avisen ABC den 18. november sidste år.
+
+Kære kolleger, vi vil undersøge alt dette. Jeg må indrømme, at det hele forekommer mig lidt forvirrende i øjeblikket. Derfor vil vi undersøge det meget omhyggeligt, således at alt er, som det skal være.
+
+Fru formand, jeg vil gerne vide, om der kommer en klar melding fra Parlamentet i denne uge om vores utilfredshed i forbindelse med dagens beslutning om ikke at forlænge embargoen mod våbeneksport til Indonesien i betragtning af, at et stort flertal i Parlamentet tidligere har undertegnet våbenembargoen i Indonesien. Dagens beslutning om ikke at forlænge embargoen er meget farlig på grund af situationen der. Parlamentet bør derfor tilkendegive sin holdning, da det er flertallets ønske. Det er uansvarligt af EU-medlemsstater at nægte at forlænge embargoen. Som nævnt tidligere er der tale om en meget ustabil situation. Der er endog fare for et militærkup i fremtiden. Vi ved ikke, hvad der sker. Så hvorfor skal våbenproducenter i EU profitere på bekostning af uskyldige mennesker?
+
+Under alle omstændigheder er punktet ikke på nuværende tidspunkt opført under forhandlingen om aktuelle og uopsættelige spørgsmål på torsdag.
+
+Arbejdsplan
+Næste punkt på dagsordenen er fastsættelse af arbejdsplanen.
+Det endelige forslag til dagsorden, som det blev opstillet af Formandskonferencen på mødet torsdag den 13. januar i overensstemmelse med forretningsordenens artikel 95, er omdelt.
+Det foreligger ingen forslag til ændring for mandag og tirsdag.
+Onsdag:
+PSE-gruppen anmoder om at få en redegørelse fra Kommissionen om dens strategiske mål for de kommende fem år samt om den administrative reform opført på dagsordenen.
+Hvis hr. Barón Crespo, der har fremsat anmodningen, ønsker det, opfordrer jeg ham til at begrunde sit forslag. Dernæst gør vi, som vi plejer, det vil sige, at vi hører et indlæg for og et indlæg imod forslaget.
+
+Fru formand, forelæggelsen af Prodi-Kommissionens politiske program for hele valgperioden var til at begynde med et forslag fra De Europæiske Socialdemokraters Gruppe, som opnåede enstemmighed på Formandskonferencen i september og også hr. Prodis udtrykkelige accept, og han gentog sit løfte i sin indsættelsestale.
+Dette løfte er vigtigt, fordi Kommissionen er et organ, der har initiativmonopol i henhold til traktaterne og derfor grundlæggende udformer Parlamentets politiske arbejde og lovgivningsarbejde i de kommende fem år. Jeg vil også minde om, fru formand, at Parlamentet to gange i foregående valgperiode ved afstemning gav udtryk for sin tillid til formand Prodi. I denne valgperiode igen i juli og senere, med den nye Kommission på plads, gav det igen i september hele Kommissionen et tillidsvotum. Der har derfor været tid nok til, at Kommissionen kunne forberede sit program, og til at vi kunne få kendskab til det og forklare det til borgerne. I den forbindelse vil jeg minde om beslutningen fra 15. september, hvori der blev henstillet til, at forslaget blev forelagt hurtigst muligt.
+Det, der skete i sidste uge - og som opstod uden for Formandskonferencen, hvor den udelukkende blev brugt til at bekræfte og godkende beslutninger, som var truffet uden for den - skaber et dilemma: Enten er Kommissionen ikke i stand til at fremlægge det program. (I så fald ville det være passende, at den informerede om det. Ifølge kommissionsformandens udsagn er de i stand til at gøre det. Eftersom Kommissionen er repræsenteret af næstformanden, fru de Palacio, mener jeg, at det før afstemningen ville være på sin plads at være på det rene med Kommissionens situation, hvad angår dets vilje til at forelægge programmet, ligesom det var blevet aftalt.) Eller også er Parlamentet ikke i stand til at behandle dette program, som der vist er nogle, der påstår. Efter min mening ville denne anden hypotese være det samme som at give afkald på vores ansvar som parlament og desuden at indføre en original teori, en ukendt metode, der består i skriftligt at give de politiske grupper kendskab til Kommissionens program en uge før - og ikke dagen før, som det var aftalen - i betragtning af, at lovgivningsprogrammet skal diskuteres i februar, således at vi kunne springe forhandlingen over, fordi pressen og Internettet dagen efter havde givet alle borgerne kendskab til det, og Parlamentet ville ikke længere behøve at bekymre sig om sagen.
+Da min gruppe mener, at et parlament er til for at lytte, diskutere og overveje, mener vi, at der ikke er noget som helst, der kan retfærdiggøre denne udsættelse, og vi mener, at hvis Kommissionen er i stand til at gøre det, er der tid nok til, at vi kan genetablere den oprindelige aftale mellem Parlamentet og Kommissionen og handle ansvarligt over for vores medborgere. Derfor går det forslag, som De Europæiske Socialdemokraters Gruppe stiller, og som De har nævnt, ud på, at vi holder fast ved forelæggelsen af Prodi-Kommissionens program for valgperioden på onsdag, og at dette program også omfatter forslaget til administrativ reform, for hvis det ikke bliver sådan, kan vi komme i en paradoksal situation: Med en undskyldning om at der ikke er en tekst, nægtes formanden for Kommissionen på den ene side retten til at tale i Parlamentet, og på den anden side forhindres det, at der finder en forhandling sted om reformen, uden at Parlamentet på forhånd kender de tekster, som den er baseret på. Derfor, fru formand, anmoder jeg Dem om at bede Kommissionen om at udtale sig nu, og at vi derefter går over til afstemning.
+(Bifald fra PSE-gruppen)
+
+Fru formand, kære kolleger, jeg er godt nok noget forbavset over vores kollega Barón Crespos opførsel. Han forlanger nu, at dette punkt sættes på dagsordenen for onsdag.
+Hr. Barón Crespo, De kunne ikke deltage den sidste torsdag på Formandskonferencen. Det kritiserer jeg ikke, for det sker af og til, at man lader sig repræsentere. Hr. Hänsch repræsenterede Dem dér. Vi havde en udførlig debat på Formandskonferencen. Kun Deres gruppe repræsenterede det, som De siger nu. Vi stemte derefter om det. Hver ordfører har jo lige så mange stemmer, som der er medlemmer i gruppen. Der var en afstemning om dette punkt. Så vidt jeg husker, faldt denne afstemning således ud: 422 mod 180 stemmer og nogle få, der undlod at stemme. Det vil sige, at alle grupper med undtagelse af løsgængerne - men de udgør jo ikke nogen gruppe - var enige, kun Deres gruppe mente, at man skulle bære sig sådan ad, som De har foreslået her. Alle andre mente noget andet. Det var beslutningen.
+Nu vil jeg gerne sige noget til selve sagen. Vi har tillid til Kommissionen, til Romano Prodi, og flertallet i vores gruppe har udtrykt tillid til Romano Prodi og Kommissionen efter en vanskelig proces, som alle kender til. Men vi mener også, at vi skal have en debat om Kommissionens strategi i en ordinær procedure, ikke kun på baggrund af en mundtlig forklaring her i Europa-Parlamentet, men også på baggrund af et dokument, som er blevet besluttet i Kommissionen, og som beskriver dette program for fem år. Et sådant dokument findes ikke!
+
+Kommissionen vil fremlægge programmet for år 2000 til februar. Vi har sagt, at hvis Kommissionen ikke ønsker at lave programmet for år 2000 i januar, så gør vi det i februar. Det har vi godkendt. Vi ønsker sådan set ikke nogen konflikt med Kommissionen, vi mener derimod, at hvis det går, skal Kommissionen og Parlamentet gå samme vej. Men Parlamentet er også Kommissionens kontrollør. Og ikke alt, hvad der kommer fra Kommissionen, skal nødvendigvis være i overensstemmelse med os.
+Jeg vil gerne have, at vi får mulighed for at forberede os fornuftigt på en debat om femårsprogrammet i grupperne. Man kan ikke forberede sig, hvis man hører en forklaring her og slet ikke ved, hvad indholdet af en sådan forklaring er. Derfor anbefaler vi - og det er mit indtryk, at Kommissionen også er åben over for denne tanke - at vi fører debatten om Kommissionens langsigtede program frem til år 2005 i februar - jeg håber også, at Kommissionen er blevet enig om et program til den tid, som den vil foreslå os - og at vi samtidig fører en debat om Kommissionens lovgivningsprogram for år 2000 i februar. Det er således også en fornuftig saglig sammenhæng, som råder os til at føre debatten om begge programmer i fællesskab. Derfor afviser min gruppe på det bestemteste Den Socialdemokratiske Gruppes forslag!
+(Bifald fra PPE-DE-gruppen)
+
+Fru formand, jeg vil gøre det meget klart, at Kommissionen først og fremmest har den største respekt for Parlamentets beslutninger, deriblandt opstillingen af dagsordenen. Derfor respekterer vi Parlamentets beslutning, hvad det angår.
+Men jeg vil også gøre det meget klart, at hr. Prodi aftalte med Parlamentet at indføre en ny forhandling, som hr. Barón nok husker, ud over den årlige forhandling om Kommissionens lovgivningsprogram, om hovedlinjerne i aktionerne for den kommende femårsperiode, altså for denne valgperiode.
+Jeg vil sige, fru formand, at denne forhandling i den aftale, som blev indgået i september, adskilte sig fra Kommissionens årlige forelæggelse af programmet for lovgivningen. Og jeg vil sige, fru formand, at vi i Kommissionen er forberedt på og rede til at deltage i den forhandling, når det er belejligt, at vi var rede til at gennemføre den i denne uge, som det var aftalt fra begyndelsen, med udgangspunkt i at den blev forelagt dagen før i en tale til de parlamentariske grupper.
+Jeg vil derfor gentage, fru formand, at vi for vores del har diskuteret handlingsprogrammet for de kommende fem år, og at vi er rede til, når Parlamentet bestemmer det - i denne uge, hvis det er beslutningen - at komme og forelægge programmet for de kommende fem år og i næste måned programmet for 2000, hvilket er helt i overensstemmelse med aftalen.
+
+Jeg foreslår, at vi stemmer om PSE-gruppens anmodning om at få en redegørelse fra Kommissionen om dens strategiske mål genopført på dagsordenen.
+(Forslaget forkastedes) Formanden. Stadig med hensyn til dagsordenen for onsdag har jeg et forslag om de mundtlige forespørgsler om kapitalskat. PPE-DE-gruppen ønsker, at dette punkt tages af dagsordenen.
+Ønsker nogen at tage ordet på vegne af gruppen for at begrunde denne anmodning?
+
+Fru formand, da jeg kan høre en smule latter fra Socialdemokraterne - jeg har fået fortalt, at brede kredse i Den Socialdemokratiske Gruppe også gerne vil have taget dette punkt af dagsordenen, fordi der ved afstemningen på Formandskonferencen ikke forelå noget votum fra arbejdsgruppen af ansvarlige kolleger i Den Socialdemokratiske Gruppe. Jeg ved ikke, om denne oplysning er rigtig, men PPE-DE-gruppen ville i hvert fald være taknemmelig, hvis dette punkt blev annulleret, fordi Parlamentet allerede har beskæftiget sig med dette spørgsmål flere gange. Der er også truffet beslutninger mod en sådan skat. Derfor anmoder min gruppe om, at dette punkt tages af dagsordenen.
+
+Tak, hr. Poettering.
+Vi skal nu høre hr. Wurtz, der er imod forslaget.
+
+Fru formand, jeg vil først og fremmest fremhæve hr. Poetterings manglende konsekvens. For et øjeblik siden belærte han socialdemokraterne, fordi de ville ændre en klar beslutning truffet på Formandskonferencen. Imidlertid gør han det samme. Vi havde en diskussion, vi var alle - på nær PPE-DE-gruppen og Den Liberale Gruppe - enige, og jeg bemærkede endda - som De sikkert husker, kære medformænd - at det ikke drejede sig om, hvorvidt De er for eller imod Tobin-afgiften, men om De turde høre, hvad Kommissionen og Rådet mente om den. Dette er ikke for meget forlangt. Derfor fastholder jeg forslaget om at bevare det mundtlige spørgsmål til Kommissionen og Rådet, således at vi én gang for alle får opklaret, hvilken holdning de to institutioner har til dette ret beskedne forslag, som dog sender et vigtigt signal til befolkningen, navnlig efter fiaskoen i Seattle.
+
+Vi skal stemme om PPE-DE-gruppens anmodning om, at de mundtlige forespørgsler om kapitalskat tages af dagsordenen.
+(Forslaget forkastedes. 164 stemte for, 166 stemte imod, og 7 undlod at stemme)
+
+Fru formand, jeg vil gerne takke hr. Poettering for den reklame, han netop har gjort for denne debat. Tak.
+
+Fru formand, er min stemme, som jeg ikke kunne afgive elektronisk, fordi jeg ikke har kortet, blevet talt med? Jeg stemte for.
+
+Det er rigtigt. Hvis vi tilføjer de to kolleger, der har givet sig til kende, bliver resultatet ...
+
+Fru formand, formandskabet har bekendtgjort afstemningens udfald. Det kan der ikke laves om på.
+
+Kære kolleger, jeg minder endnu en gang om, at det er vigtigt, at alle har deres kort om mandagen. Det er tydeligt, at vi har et problem, og jeg må derfor træffe en beslutning.
+Jeg har også glemt mit kort, og jeg ville have stemt imod. Derfor mener jeg, at det mundtlige spørgsmål fortsat skal medtages på dagsordenen.
+Det er sidste gang, vi vil tage hensyn til glemte kort. Lad dette være helt klart, og husk det.
+(Bifald)
+Ja, det mundtlige spørgsmål er fortsat opført på dagsordenen, og ja, formanden har ret til at stemme, ligesom hun har ret til at glemme sit kort.
+Vi fortsætter nu med de øvrige ændringer af dagsordenen.
+
+Fru formand, i den tidligere afstemning - og jeg vil rette mig efter Deres afgørelse om dette emne - om spørgsmålet om Kommissionens redegørelse om dens strategiske mål gav jeg udtryk for, at jeg gerne ville tale på vegne af min gruppe før afstemningen. Det blev ikke til noget. Jeg vil sætte pris på at få lejlighed til at afgive stemmeforklaring på vegne af min gruppe i forbindelse med afslutningen af dette spørgsmål. Det er et vigtigt spørgsmål, og det vil være nyttigt for Parlamentet, hvis det er angivet, hvordan de forskellige personer opfatter vores handlinger i lyset af deres egne politiske analyser.
+
+Fru formand, jeg vil ikke genoptage debatten, men jeg havde også meldt mig for at tage stilling til hr. Barón Crespos ændringsforslag. De råbte mig heller ikke op. Det beklager jeg, men afstemningen er gennemført, afgørelsen er truffet, vi lader det altså ligge.
+
+Jeg beklager, hr. Hänsch og hr. Cox, jeg så ikke, at De anmodede om ordet. Men i øvrigt mener jeg, at holdningerne er meget klare, og de vil blive indført i protokollen. Når vi i morgen skal vedtage protokollen for i dag, kan de kolleger, der ikke synes, at holdningerne er blevet tilstrækkeligt forklaret, anmode om ændringer. Det, mener jeg, er en god løsning. Selvfølgelig vil protokollen for mødet i morgen tage hensyn til alle de supplerende forklaringer. Jeg mener, at det er en bedre løsning end at gå over til stemmeforklaringer på nuværende tidspunkt, som ville være et stort sidespring. Hr. Cox og hr. Hänsch, passer denne løsning Dem?
+
+Fru formand, hvis protokollen giver korrekt udtryk for min gruppes holdning i forbindelse med afstemningen, vil og kan jeg ikke gøre indsigelser. Hvis De afgør, at der ikke er grund til at afgive stemmeforklaring, vil jeg acceptere det, men med forbehold.
+
+Vi vil derfor være meget opmærksomme på udarbejdelsen af protokollen. Det er vi i øvrigt altid. Hvis holdningerne ikke klart fremgår, kan vi eventuelt ændre den.
+(Den således ændrede dagsorden godkendtes)
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/TestNGramProfile.java
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/TestNGramProfile.java (revision 180032)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/TestNGramProfile.java (working copy)
@@ -19,36 +19,21 @@
import java.io.ByteArrayOutputStream;
import java.io.InputStream;
import java.util.Iterator;
-import java.util.Vector;
+import java.util.List;
import junit.framework.TestCase;
-import org.apache.lucene.analysis.Token;
+
public class TestNGramProfile extends TestCase {
String tokencontent1 = "testaddtoken";
String tokencontent2 = "anotherteststring";
- int[] counts1 = { 3, 2, 2, 2, 1, 1, 1, 1, 1 };
+ int[] counts1 = { 3, 2, 2, 1, 1, 1, 1, 1 };
- String[] chars1 = { "t", "_", "d", "e", "a", "k", "n", "o", "s" };
+ String[] chars1 = { "t", "d", "e", "a", "k", "n", "o", "s" };
- /**
- * Test addFromToken method
- *
- */
- public void testAddToken() {
- NGramProfile p = new NGramProfile("test", 1, 1);
-
- Token t = new Token(tokencontent1, 0, tokencontent1.length());
- p.addFromToken(t);
- p.normalize();
-
- testCounts(p.getSorted(), counts1);
- testContents(p.getSorted(), chars1);
- }
-
/**
* Test analyze method
*/
@@ -58,31 +43,16 @@
NGramProfile p = new NGramProfile("test", 1, 1);
p.analyze(new StringBuffer(tokencontent));
- //test that profile size is ok, eg 9 different NGramEntries "_tesmagin"
- assertEquals(9, p.getSorted().size());
- }
-
- /**
- * Test addNGrams method with StringBuffer argument
- *
- */
- public void testAddNGramsStringBuffer() {
- String tokencontent = "testmeagain";
-
- NGramProfile p = new NGramProfile("test", 1, 1);
- p.addNGrams(new StringBuffer(tokencontent));
-
//test that profile size is ok, eg 8 different NGramEntries "tesmagin"
assertEquals(8, p.getSorted().size());
-
}
/**
* test getSorted method
*/
public void testGetSorted() {
- int[] count = { 4, 3, 2, 1 };
- String[] ngram = { "a", "b", "" + NGramProfile.SEPARATOR, "c" };
+ int[] count = { 4, 3, 1 };
+ String[] ngram = { "a", "b", "c" };
String teststring = "AAaaBbbC";
@@ -90,7 +60,7 @@
p.analyze(new StringBuffer(teststring));
//test size of profile
- assertEquals(4, p.getSorted().size());
+ assertEquals(3, p.getSorted().size());
testCounts(p.getSorted(), count);
testContents(p.getSorted(), ngram);
@@ -105,7 +75,7 @@
b.analyze(new StringBuffer(tokencontent2));
//because of rounding errors might slightly return different results
- assertEquals(a.getSimilarity(b), b.getSimilarity(a), 0.0000001);
+ assertEquals(a.getSimilarity(b), b.getSimilarity(a), 0.0000002);
}
@@ -150,7 +120,7 @@
testContents(b.getSorted(), chars1);
}
- private void testContents(Vector entries, String contents[]) {
+ private void testContents(List entries, String contents[]) {
int c = 0;
Iterator i = entries.iterator();
@@ -161,7 +131,7 @@
}
}
- private void testCounts(Vector entries, int counts[]) {
+ private void testCounts(List entries, int counts[]) {
int c = 0;
Iterator i = entries.iterator();
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/de.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/de.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/de.test (revision 0)
@@ -0,0 +1,104 @@
+Wiederaufnahme der Sitzungsperiode
+Ich erkläre die am Freitag, dem 17. Dezember unterbrochene Sitzungsperiode des Europäischen Parlaments für wiederaufgenommen, wünsche Ihnen nochmals alles Gute zum Jahreswechsel und hoffe, daß Sie schöne Ferien hatten.
+Wie Sie feststellen konnten, ist der gefürchtete "Millenium-Bug " nicht eingetreten. Doch sind Bürger einiger unserer Mitgliedstaaten Opfer von schrecklichen Naturkatastrophen geworden. Im Parlament besteht der Wunsch nach einer Aussprache im Verlauf dieser Sitzungsperiode in den nächsten Tagen. Heute möchte ich Sie bitten - das ist auch der Wunsch einiger Kolleginnen und Kollegen -, allen Opfern der Stürme, insbesondere in den verschiedenen Ländern der Europäischen Union, in einer Schweigeminute zu gedenken. Ich bitte Sie, sich zu einer Schweigeminute zu erheben.
+(Das Parlament erhebt sich zu einer Schweigeminute.)
+
+Frau Präsidentin, zur Geschäftsordnung. Wie Sie sicher aus der Presse und dem Fernsehen wissen, gab es in Sri Lanka mehrere Bombenexplosionen mit zahlreichen Toten. Zu den Attentatsopfern, die es in jüngster Zeit in Sri Lanka zu beklagen gab, zählt auch Herr Kumar Ponnambalam, der dem Europäischen Parlament erst vor wenigen Monaten einen Besuch abgestattet hatte. Wäre es angemessen, wenn Sie, Frau Präsidentin, der Präsidentin von Sri Lanka in einem Schreiben das Bedauern des Parlaments zum gewaltsamen Tod von Herrn Ponnambalam und anderen Bürgern von Sri Lanka übermitteln und sie auffordern würden, alles in ihrem Kräften stehende zu tun, um nach einer friedlichen Lösung dieser sehr schwierigen Situation zu suchen?
+
+Ja, Herr Evans, ich denke, daß eine derartige Initiative durchaus angebracht ist. Wenn das Haus damit einverstanden ist, werde ich dem Vorschlag von Herrn Evans folgen.
+
+Frau Präsidentin, zur Geschäftsordnung. Könnten Sie mir eine Auskunft zu Artikel 143 im Zusammenhang mit der Unzulässigkeit geben? Meine Frage betrifft eine Angelegenheit, die am Donnerstag zur Sprache kommen wird und auf die ich dann erneut verweisen werde.
+Das Parlament wird sich am Donnerstag mit dem Cunha-Bericht über mehrjährige Ausrichtungsprogramme befassen, der in Absatz 6 vorschlägt, daß Länder, die ihr Soll zur Flottenverkleinerung nicht erfüllen, jährlich mit einer Art Quotenstrafe belegt werden sollen. Und zwar sollen derartige Strafen trotz des Grundsatzes der relativen Stabilität verhängt werden. Ich meine, daß der Grundsatz der relativen Stabilität einen elementaren Rechtsgrundsatz der gemeinsamen Fischereipolitik darstellt und ein Vorschlag, diesen zu unterlaufen, rechtlich unzulässig wäre. Ich möchte wissen, ob es möglich ist, einen Einwand gegen ein Dokument zu erheben, bei dem es sich lediglich um einen Bericht und keinen Legislativvorschlag handelt, und ob ich befugt bin, dies am Donnerstag zu tun.
+
+Genau dann können Sie, wenn Sie wollen, diese Frage ansprechen, d. h. am Donnerstag zu Beginn der Aussprache über den Bericht.
+
+Frau Präsidentin! Die erste diesjährige Tagung des Europäischen Parlaments fällt leider damit zusammen, daß in den Vereinigten Staaten, in Texas, für Donnerstag dieser Woche die Hinrichtung eines zum Tode verurteilten 34jährigen jungen Mannes namens Hicks festgelegt worden ist.
+Auf Wunsch eines französischen Mitglieds, Herrn Zimeray, wurde bereits eine Petition eingereicht, die von vielen, auch von mir selbst, unterzeichnet worden ist. Gemäß der vom Europäischen Parlament und von der gesamten Europäischen Union nunmehr ständig vertretenen Linie möchte ich Sie jedoch bitten, den ganzen Einfluß Ihres Amtes und der Institution, die Sie vertreten, bei dem Präsidentschaftskandidaten und Gouverneur von Texas, George W. Bush, der zur Aussetzung der Vollstreckung des Todesurteils und zur Begnadigung des Verurteilten befugt ist, geltend zu machen.
+All dies entspricht den Grundsätzen, die wir stets verteidigt haben.
+
+Vielen Dank, Herr Segni, das will ich gerne tun. Das ist ganz im Sinne der Position, die wir als Parlament immer vertreten haben.
+
+Frau Präsidentin! Ich möchte Sie auf einen Fall aufmerksam machen, mit dem sich dieses Parlament immer wieder befaßt hat. Das ist der Fall von Alexander Nikitin. Wir freuen uns hier alle, daß das Gericht ihn freigesprochen und deutlich gemacht hat, daß auch in Rußland der Zugang zu Umweltinformationen konstitutionelles Recht ist. Nun ist es aber so, daß er wieder angeklagt werden soll, weil der Staatsanwalt in Berufung geht. Wir wissen und wir haben es in wirklich sehr vielen Entschließungen festgestellt - gerade während der letzten Plenartagung des vergangenen Jahres-, daß dies nicht nur ein juristischer Fall ist und daß es falsch ist, Alexander Nikitin Kriminalität und Verrat vorzuwerfen, weil wir als Betroffene von seinen Ergebnissen einen Nutzen haben. Diese Ergebnisse sind die Grundlage für die europäischen Programme zum Schutz der Barentsee, und deswegen bitte ich Sie, einen Briefentwurf, der Ihnen die wichtigsten Fakten schildert, zu prüfen und im Sinne der Beschlüsse des Parlaments in Rußland diese Position deutlich zu machen.
+
+Frau Schroedter, ich bin gerne bereit, die damit zusammenhängenden Fakten zu prüfen, wenn mir Ihr Brief vorliegt.
+
+Frau Präsidentin, zunächst besten Dank dafür, daß Sie Wort gehalten haben und nun in der ersten Sitzungsperiode des neuen Jahres das Angebot an Fernsehprogrammen in unseren Büros tatsächlich enorm erweitert ist. Dennoch, Frau Präsidentin, wurde meinem Wunsch nicht entsprochen. Zwar können wir jetzt zwei finnische und einen portugiesischen, nach wie vor aber keinen niederländischen Sender empfangen. Ich hatte Sie aber um ein niederländisches Programm gebeten, denn auch wir Niederländer möchten die Nachrichten verfolgen, wenn wir jeden Monat hierher in die Verbannung geschickt werden. Deshalb möchte ich Sie nochmals ersuchen, dafür Sorge zu tragen, daß auch ein niederländischer Sender eingespeist wird.
+
+Frau Plooij-van Gorsel, ich kann Ihnen mitteilen, daß dieser Punkt am Mittwoch auf der Tagesordnung der Quästoren steht. Ich hoffe, daß dort in Ihrem Sinne entschieden wird.
+
+Frau Präsidentin, können Sie mir sagen, warum sich dieses Parlament nicht an die Arbeitsschutzregelungen hält, die es selbst verabschiedet hat? Weshalb wurde die Luftqualität in diesem Gebäude seit unserer Wahl nicht ein einziges Mal überprüft? Weshalb ist der Arbeitsschutzausschuß seit 1998 nicht ein einziges Mal zusammengetreten? Warum hat weder im Brüsseler noch im Straßburger Parlamentsgebäude eine Brandschutzübung stattgefunden? Warum finden keine Brandschutzbelehrungen statt? Warum wurde nach meinem Unfall nichts unternommen, um die Treppen sicherer zu machen? Warum wird in den Nichtraucherzonen das Rauchverbot nicht durchgesetzt? Es ist eine Schande, daß wir Regeln verabschieden, an die wir uns dann selbst nicht halten.
+
+Frau Lynne, Sie haben völlig recht, und ich werde prüfen, ob all dies wirklich so ist. Ich werde die Frage auch den Quästoren unterbreiten. Ich bin mir sicher, daß diese großen Wert darauf legen, daß wir die Rechtsvorschriften, die wir verabschieden, auch selbst einhalten.
+
+Frau Präsidentin! Frau Díez González und ich hatten einige Anfragen zu bestimmten, in einer spanischen Zeitung wiedergegebenen Stellungnahmen der Vizepräsidentin, Frau de Palacio, gestellt. Die zuständigen Dienste haben sie nicht in die Tagesordnung aufgenommen, da sie der Meinung waren, sie seien schon in einer vorangegangenen Sitzung beantwortet worden.
+Ich bitte, diese Entscheidung zu überdenken, weil das nicht der Fall ist. Die früher beantworteten Anfragen bezogen sich auf das Auftreten von Frau de Palacio in einer bestimmten Angelegenheit, nicht auf die am 18. November des vergangenen Jahres in der Tageszeitung ABC erschienenen Erklärungen.
+
+Lieber Kollege, wir werden das prüfen. Ich muß Ihnen aber sagen, daß ich die Lage im Moment für etwas verworren halte. Wir werden das aber sehr genau prüfen, damit alles seine Richtigkeit hat.
+
+Frau Präsidentin, ich wüßte gern, ob das Parlament in dieser Woche ein deutliches Signal unserer Unzufriedenheit bezüglich der heutigen Entscheidung, mit der eine Verlängerung des Waffenembargos gegen Indonesien abgelehnt wird, aussenden wird, zumal sich die große Mehrheit in diesem Parlament in der Vergangenheit für das Waffenembargo gegen Indonesien ausgesprochen hat. Die heutige Entscheidung gegen eine Verlängerung des Embargos birgt angesichts der dortigen Lage eine sehr große Gefahr. Das Parlament sollte, da dies dem Wunsch der großen Mehrheit entspricht, eine entsprechende Botschaft senden. Die Ablehnung einer Verlängerung des Embargos seitens der EU-Mitgliedstaaten ist unverantwortlich. Wie bereits festgestellt wurde, ist die Lage in Indonesien äußerst instabil. Es besteht sogar die Gefahr eines Militärputsches. Wir wissen nicht, was passiert. Weshalb also sollten Waffenhersteller in der EU auf Kosten unschuldiger Menschen Profite einstreichen?
+
+Dieser Punkt ist bisher nicht für die Dringlichkeitsdebatte am Donnerstag vorgesehen.
+
+Arbeitsplan
+Nach der Tagesordnung folgt die Prüfung des endgültigen Entwurfs der Tagesordnung, wie er nach Artikel 110 der Geschäftsordnung am Donnerstag, dem 13. Januar von der Konferenz der Präsidenten festgelegt wurde. Zu Montag und Dienstag liegen keine Änderungen vor.
+Zum Mittwoch:
+Die Sozialdemokratische Fraktion beantragt, eine Erklärung der Kommission über ihre strategischen Ziele für die nächsten fünf Jahre sowie über die Verwaltungsreform der Kommission in die Tagesordnung aufzunehmen.
+Ich bitte den Antragsteller, Herrn Barón Crespo, seinen Antrag zu begründen, falls er dies wünscht. Danach verfahren wir wie üblich: ein Redner dafür, einer dagegen.
+
+Frau Präsidentin! Die Vorstellung des politischen Programms der Kommission Prodi für die gesamte Wahlperiode ging auf einen Vorschlag der Fraktion der Sozialdemokratischen Partei Europas zurück, der die einhellige Billigung der Konferenz der Präsidenten im September und auch die ausdrückliche Zustimmung von Präsident Prodi fand, der seine Zusage in seiner Antrittsrede bekräftigte.
+Diese Zusage ist insofern von Bedeutung, als die Kommission ein Organ ist, das nach den Verträgen das Initiativmonopol besitzt und somit grundlegend die politische und legislative Tätigkeit dieses Parlaments in den nächsten fünf Jahren gestaltet. Ich möchte auch daran erinnern, daß dieses Parlament in der vorangegangenen Wahlperiode Präsident Prodi zweimal sein Vertrauen ausgesprochen hat; in dieser Wahlperiode sprach es ihm im Juli erneut sein Vertrauen aus, und dann, als die neue Kommission im Amt war, gab es im September erneut ein Vertrauensvotum für die Kommission insgesamt. Somit hatte die Kommission bereits genügend Zeit, ihr Programm zu erarbeiten, und wir, um es kennenlernen und den Bürgern erklären zu können. In diesem Sinne erinnere ich an die Entschließung vom 15. September, in der empfohlen wurde, den Vorschlag in der kürzestmöglichen Frist vorzulegen.
+Die Ereignisse der vergangenen Woche - die am Rande der Konferenz der Präsidenten ihren Anfang nahmen und wobei diese Konferenz nur zur Bestätigung und Ratifizierung von außerhalb gefaßten Beschlüssen genutzt wurde - verdeutlichen ein Dilemma: Entweder ist die Kommission nicht in der Lage, dieses Programm vorzulegen (In diesem Fall sollte sie eine Klärung herbeiführen. Nach den Worten ihres Präsidenten ist sie dazu in der Lage. Da die Kommission durch die Vizepräsidentin, Frau de Palacio, vertreten ist, halte ich es für zweckmäßig, vor der Abstimmung die Position der Kommission hinsichtlich ihrer Bereitschaft zur Vorstellung des Programms, so wie es vereinbart war, zu erfahren.), oder das Parlament ist zur Prüfung dieses Programms nicht in der Lage, wie einige offenbar vorgeben. Nach meiner Ansicht würde diese zweite Hypothese einem Verzicht auf unsere Verantwortung als Parlament und darüber hinaus dem Aufwerfen einer originellen These, einer unbekannten Methode gleichkommen, die darin bestände, den Fraktionen die programmatische Rede der Kommission in schriftlicher Form eine Woche vorher - und nicht, wie vereinbart, am Tag zuvor - zur Kenntnis zu geben, wobei zu berücksichtigen ist, daß das Legislativprogramm im Februar diskutiert werden wird, so daß wir auf die Aussprache verzichten könnten, da die Presse und das Internet am Tag darauf alle Bürger darüber informiert haben würden und das Parlament keinen Grund mehr hätte, sich mit der Angelegenheit zu befassen.
+Da meine Fraktion der Meinung ist, daß ein Parlament dazu da ist, zuzuhören, zu diskutieren und nachzudenken, gibt es unserer Ansicht nach keinen Grund zur Rechtfertigung dieser Verzögerung, und wir glauben, wenn die Kommission dazu in der Lage ist, liegen wir genau in der Zeit, um die ursprüngliche Vereinbarung zwischen dem Parlament und der Kommission wieder in Kraft zu setzen und verantwortungsbewußt vor unsere Mitbürgerinnen und Mitbürgern treten zu können. Deshalb besteht der Vorschlag der Fraktion der Sozialdemokratischen Partei Europas, den Sie erwähnt haben, darin, den Mittwoch als Termin der Vorstellung des Programms der Kommission Prodi für die Wahlperiode beizubehalten, und in dieses Programm auch das Verwaltungsreformprojekt einzubeziehen, da wir andernfalls in eine paradoxe Situation geraten könnten: Mit der Ausrede, der Wortlaut liege nicht vor, wird einerseits dem Präsidenten der Kommission das Recht abgesprochen, in diesem Parlament zu sprechen, und andererseits würde eine Aussprache über die Reform stattfinden, ohne daß dieses Parlament zuvor die Texte lesen konnte, die der Aussprache zugrunde liegen. Daher bitte ich Sie, Frau Präsidentin, die Kommission zu ersuchen, sich jetzt zu äußern, und danach zur Abstimmung zu schreiten.
+(Beifall der PSE-Fraktion)
+
+Frau Präsidentin, liebe Kolleginnen und Kollegen! Ich bin doch etwas erstaunt über das Verhalten des Kollegen Barón Crespo, der jetzt verlangt, daß dieser Tagesordnungspunkt auf die Tagesordnung für Mittwoch gesetzt wird.
+Herr Kollege Barón Crespo, Sie konnten am letzten Donnerstag in der Konferenz der Präsidenten nicht anwesend sein. Das kritisiere ich nicht; es kommt immer mal vor, daß man sich vertreten läßt. Der Kollege Hänsch hat Sie dort vertreten. Wir haben in der Konferenz der Präsidenten eine ausführliche Debatte geführt. Nur Ihre Fraktion hat das vertreten, was Sie jetzt sagen. Wir haben dann abgestimmt. Jeder Vorsitzende bzw. jede Vorsitzende hat ja so viele Stimmen, wie die Fraktion Mitglieder hat. Es gab eine Abstimmung zu diesem Punkt. Diese Abstimmung ist meiner Erinnerung nach so ausgegangen: 422 gegen 180 Stimmen bei einigen wenigen Enthaltungen. Das heißt, alle Fraktionen, mit Ausnahme der Fraktionslosen - aber die sind ja keine Fraktion - waren sich einig, nur Ihre Fraktion war der Meinung, so zu verfahren, wie Sie es hier vorgeschlagen haben. Alle anderen waren anderer Meinung. Das war der Beschluß.
+Jetzt möchte ich zur Sache selbst etwas sagen. Wir haben Vertrauen zur Kommission, zu Romano Prodi, und die ganz große Mehrheit unserer Fraktion hat Romano Prodi und der Kommission nach einem schwierigen Prozeß, wie jeder weiß, das Vertrauen ausgesprochen. Aber wir sind auch der Meinung, daß wir eine Debatte über diese Strategie der Kommission in einem geordneten Verfahren führen müssen, nicht nur aufgrund einer mündlichen Erklärung hier im Europäischen Parlament, sondern auch aufgrund eines Dokumentes, das in der Kommission beschlossen ist und dieses Programm für fünf Jahre beschreibt. Ein solches Dokument gibt es nicht!
+
+Die Kommission wird das Programm für das Jahr 2000 im Februar vorlegen. Wir haben gesagt, o. k, wenn die Kommission das Programm 2000 noch nicht im Januar machen will, dann machen wir das im Februar. Wir haben dem zugestimmt. Wir wollen ja an sich keinen Streit mit der Kommission, sondern wir sind der Meinung, wenn es eben geht, müssen Kommission und Parlament einen gemeinsamen Weg gehen. Aber wir als Parlament sind auch der Kontrolleur der Kommission. Und nicht alles, was von der Kommission kommt, muß unsere Meinung sein.
+Ich möchte, daß wir uns auf eine Debatte über das Fünfjahresprogramm in den Fraktionen vernünftig vorbereiten können. Man kann sich nicht vorbereiten, wenn man hier eine Erklärung hört und gar nicht weiß, was Inhalt einer solchen Erklärung ist. Deswegen ist es unsere Empfehlung - und mein Eindruck ist, daß die Kommission auch aufgeschlossen ist für diesen Gedanken -, daß wir im Februar die Debatte über das langfristige Programm der Kommission bis zum Jahre 2005 führen - ich hoffe, die Kommission wird sich bis dahin auch auf ein Programm verständigen, das sie uns vorschlagen wird -, und daß wir gleichzeitig im Februar auch die Debatte über das Legislativprogramm der Kommission für das Jahr 2000 führen. Es ist also auch ein vernünftiger sachlicher Zusammenhang, der uns rät, die Debatte über beide Programme gemeinsam zu führen. Deswegen lehnt meine Fraktion den Vorschlag der Sozialistischen Fraktion entschieden ab!
+(Beifall von der PPE-DE-Fraktion)
+
+Frau Präsidentin! Ich möchte ganz deutlich sagen, daß die Kommission vor allem höchsten Respekt gegenüber den Beschlüssen dieses Parlaments hat, und dazu gehört die Aufstellung seiner Tagesordnung. Deshalb respektieren wir die Entscheidungen des Parlaments in diesem Sinne. Aber ich möchte auch ganz deutlich zum Ausdruck bringen, daß sich Präsident Prodi gegenüber dem Parlament, wie Herr Barón in Erinnerung brachte, zu einer neuen Aussprache verpflichtet hat, die zusätzlich zu der Jahresaussprache über das Legislativprogramm der Kommission, über die großen Aktionslinien für den nächsten Fünfjahreszeitraum, das heißt, für diese Wahlperiode, stattfinden soll.
+Ich möchte sagen, daß diese Aussprache in der im September getroffenen Vereinbarung von der Jahresvorlage des Legislativprogramms der Kommission abgetrennt wurde. Und ich möchte auch sagen, daß wir seitens der Kommission auf diese Aussprache vorbereitet und bereit sind, sie zum geeigneten Zeitpunkt zu führen, daß wir für diese Woche darauf vorbereitet waren, wie dies grundsätzlich vereinbart war, wobei man am Vorabend vor den Fraktionen des Parlaments mit einer Rede auftreten wollte.
+Deshalb, Frau Präsidentin, möchte ich bekräftigen, daß wir unsererseits das Aktionsprogramm für die nächsten fünf Jahre diskutiert haben und darauf vorbereitet sind, sofern es vom Parlament so beschlossen wird - noch in dieser Woche, wenn der Beschluß so lautet -, das Fünfjahresprogramm und im nächsten Monat das Programm für das Jahr 2000, genau so wie vereinbart, vorzustellen.
+
+Ich schlage vor, daß wir über den Antrag der Sozialdemokratischen Fraktion, die Erklärung der Kommission über ihre strategischen Ziele wieder auf die Tagesordnung zu setzen, abstimmen.
+(Das Parlament lehnt den Antrag ab.) Die Präsidentin. Zum Mittwoch liegt mir noch ein weiterer Antrag betreffend die mündliche Anfrage über die Kapitalsteuer vor. Die PPE/DE-Fraktion beantragt, diesen Punkt von der Tagesordnung abzusetzen.
+Möchte jemand den Antrag im Namen der Fraktion begründen?
+
+Frau Präsidentin, da ich bei den Sozialisten ein bißchen Gelächter höre - mir wurde gesagt, daß auch weite Kreise der Sozialistischen Fraktion diesen Tagesordnungspunkt gern abgesetzt haben wollen, weil bei der Abstimmung in der Konferenz der Präsidenten das Votum der Arbeitsgruppe der zuständigen Kolleginnen und Kollegen der Sozialistischen Fraktion nicht vorlag. Ich weiß nicht, ob diese Information richtig ist, aber wir als EVP-ED-Fraktion wären jedenfalls dankbar, wenn dieser Punkt abgesetzt würde, weil sich das Parlament nämlich schon mehrfach mit dieser Frage befaßt hat. Es gibt auch Beschlüsse gegen eine solche Steuer. Deswegen beantragt meine Fraktion, diesen Punkt von der Tagesordnung abzusetzen.
+
+Vielen Dank, Herr Poettering.
+Wir kommen nun zu Herrn Wurtz, der gegen den Antrag spricht.
+
+Frau Präsidentin, ich möchte zunächst darauf hinweisen, daß das, was Herr Poettering da sagt, nicht ganz logisch ist. Zum einen belehrt er die Sozialdemokratische Fraktion, weil diese eine ganz klare und eindeutige Entscheidung der Konferenz der Präsidenten in Frage stellt. Und nun tut er genau dasselbe. Wir haben diskutiert, wir waren uns einig, nur die EVP-Fraktion und die Liberalen nicht. Und ich hatte noch darauf hingewiesen, die anderen Präsidentenkollegen werden sich noch daran erinnern, daß es nicht darum geht, ob man für oder gegen die Tobin-Steuer ist, sondern darum, ob wir bereit sind, uns anzuhören, was die Kommission und der Rat davon halten. Das ist nicht zuviel verlangt. Ich wiederhole also den Vorschlag, diese mündliche Anfrage an die Kommission und den Rat aufrechtzuerhalten, um ein für alle Mal die Meinung dieser beiden Institutionen zu diesem relativ bescheidenen Vorschlag zu erfahren, der für die Öffentlichkeit ein wichtiges Signal wäre, insbesondere nach der Aufregung im Gefolge des Scheiterns der Konferenz von Seattle.
+
+Wir stimmen jetzt über den Antrag der PPE/DE-Fraktion ab, die mündliche Anfrage über die Kapitalsteuer von der Tagesordnung abzusetzen.
+(Das Parlament lehnt den Antrag mit 164 Ja-Stimmen, 166 Nein-Stimmen und 7 Enthaltungen ab.)
+
+Frau Präsidentin, ich möchte Herrn Poettering für das Rühren der Werbetrommel zugunsten dieser Aussprache danken. Vielen Dank.
+
+Frau Präsidentin! Ist meine Stimme mitgezählt worden? Ich konnte sie nämlich nicht elektronisch abgeben, weil ich die Karte nicht habe. Ich habe "dafür " gestimmt.
+
+In der Tat, wenn man die beiden Mitglieder, die sich gemeldet haben hinzuzählt, dann ergibt sich als Ergebnis ...
+
+Frau Präsidentin! Die Präsidentschaft hat das Ergebnis der Abstimmung verkündet. Änderungen sind nicht möglich.
+
+Liebe Kolleginnen und Kollegen, ich muß Sie nochmals daran erinnern, montags Ihre Stimmkarte mitzubringen. Wir haben da offensichtlich ein Problem, und ich muß jetzt eine Entscheidung treffen.
+Auch ich habe meine Stimmkarte vergessen, und ich hätte dagegen gestimmt. Ich gehe somit davon aus, daß die mündliche Anfrage auf der Tagesordnung bleibt.
+Das war das letzte Mal, daß wir vergessene Karten berücksichtigen. Damit das ein für alle Mal klar ist!
+(Beifall)
+Richtig, damit bleibt die mündliche Anfrage auf der Tagesordnung, und richtig, die Präsidentin hat das Recht abzustimmen, wie sie auch das Recht hat, ihre Stimmkarte zu vergessen.
+Wir kommen nun zu den weiteren Änderungen der Tagesordnung.
+
+Frau Präsidentin, bei der früheren Abstimmung zur Frage des Strategieplans der Kommission - keine Angst, ich werde mich an Ihre Entscheidung in dieser Sache halten - hatte ich darum gebeten, vor der Abstimmung im Namen meiner Fraktion sprechen zu dürfen. Dazu kam es nicht. Ich würde es begrüßen, wenn ich zum Abschluß dieses Geschäftspunktes die Möglichkeit hätte, im Namen meiner Fraktion eine Erklärung zur Abstimmung abzugeben. Das ist eine wichtige Angelegenheit. Vielleicht wäre es sinnvoll festzuhalten, wie das, was wir eben getan haben, von den einzelnen vor dem Hintergrund ihrer eigenen politischen Analyse aufgenommen wird.
+
+Frau Präsidentin! Ich will die Debatte nicht wieder aufnehmen, aber ich hatte mich auch gemeldet, um zu dem Antrag von Herrn Barón Crespo Stellung zu nehmen. Sie haben mich auch nicht aufgerufen. Ich bedauere das, aber die Abstimmung ist durchgeführt worden, die Entscheidung ist gefallen, also lassen wir die Dinge.
+
+Das tut mir leid, Herr Hänsch und Herr Cox. Ich hatte nicht gesehen, daß Sie ums Wort gebeten hatten. Doch die Positionen sind deutlich geworden und werden ins Protokoll aufgenommen. Wenn wir morgen das Protokoll der Sitzung von heute verabschieden, können die Kolleginnen und Kollegen, die der Auffassung sind, daß die Positionen nicht ausreichend klar geworden sind, Änderungen beantragen. Ich halte dieses Vorgehen für angemessen. Natürlich werden im Protokoll der Sitzung von morgen sämtliche zusätzlichen Erläuterungen berücksichtigt. Ich halte das für besser als jetzt lange Stimmerklärungen abzugeben. Herr Cox, Herr Hänsch, sind Sie damit einverstanden?
+
+Frau Präsidentin, wenn aus der Abstimmung einwandfrei hervorgeht, wie meine Fraktion abgestimmt hat, dann werde und kann ich nichts dagegen sagen. Wenn Sie festlegen, daß ich keine Erklärung zur Abstimmung abgeben kann, akzeptiere ich das, wenngleich unter Vorbehalt.
+
+Beim Abfassen des Protokolls werden wir mit großer Sorgfalt vorgehen. Das tun wir im übrigen immer. Wenn Positionen nicht richtig wiedergegeben werden, können wir das Protokoll gegebenenfalls ändern.
+(Das Parlament genehmigt den geänderten Arbeitsplan.)
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/TestLanguageIdentifier.java
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/TestLanguageIdentifier.java (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/TestLanguageIdentifier.java (revision 0)
@@ -0,0 +1,242 @@
+/**
+ * Copyright 2005 The Apache Software Foundation
+ *
+ * Licensed under the Apache License, Version 2.0 (the "License");
+ * you may not use this file except in compliance with the License.
+ * You may obtain a copy of the License at
+ *
+ * http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+package org.apache.nutch.analysis.lang;
+
+// JDK imports
+import java.io.InputStream;
+import java.io.BufferedReader;
+import java.io.InputStreamReader;
+import java.io.ByteArrayInputStream;
+import java.io.ByteArrayOutputStream;
+import java.util.List;
+import java.util.Iterator;
+
+// JUnit imports
+import junit.framework.Test;
+import junit.framework.TestCase;
+import junit.framework.TestSuite;
+import junit.textui.TestRunner;
+
+// Lucene imports
+import org.apache.lucene.analysis.Token;
+
+
+/**
+ * JUnit based test of class {@link LanguageIdentifier}.
+ *
+ * @author Sami Siren
+ * @author Jerome Charron - http://frutch.free.fr/
+ */
+public class TestLanguageIdentifier extends TestCase {
+
+
+ public TestLanguageIdentifier(String testName) {
+ super(testName);
+ }
+
+ public static Test suite() {
+ return new TestSuite(TestLanguageIdentifier.class);
+ }
+
+ public static void main(String[] args) {
+ TestRunner.run(suite());
+ }
+
+ String tokencontent1 = "testaddtoken";
+ String tokencontent2 = "anotherteststring";
+
+ int[] counts1 = { 3, 2, 2, 1, 1, 1, 1, 1 };
+
+ String[] chars1 = { "t", "d", "e", "a", "k", "n", "o", "s" };
+
+ /**
+ * Test addFromToken method
+ *
+ */
+ public void testAddToken() {
+
+ NGramProfile p = new NGramProfile("test", 1, 1);
+
+ Token t = new Token(tokencontent1, 0, tokencontent1.length());
+ p.add(t);
+ p.normalize();
+
+ testCounts(p.getSorted(), counts1);
+ testContents(p.getSorted(), chars1);
+ }
+
+ /**
+ * Test analyze method
+ */
+ public void testAnalyze() {
+ String tokencontent = "testmeagain";
+
+ NGramProfile p = new NGramProfile("test", 1, 1);
+ p.analyze(new StringBuffer(tokencontent));
+
+ //test that profile size is ok, eg 9 different NGramEntries "tesmagin"
+ assertEquals(8, p.getSorted().size());
+ }
+
+ /**
+ * Test addNGrams method with StringBuffer argument
+ *
+ */
+ public void testAddNGramsStringBuffer() {
+ String tokencontent = "testmeagain";
+
+ NGramProfile p = new NGramProfile("test", 1, 1);
+ p.add(new StringBuffer(tokencontent));
+
+ //test that profile size is ok, eg 8 different NGramEntries "tesmagin"
+ assertEquals(8, p.getSorted().size());
+
+ }
+
+ /**
+ * test getSorted method
+ */
+ public void testGetSorted() {
+ int[] count = { 4, 3, 1 };
+ String[] ngram = { "a", "b", "c" };
+
+ String teststring = "AAaaBbbC";
+
+ NGramProfile p = new NGramProfile("test", 1, 1);
+ p.analyze(new StringBuffer(teststring));
+
+ //test size of profile
+ assertEquals(3, p.getSorted().size());
+
+ testCounts(p.getSorted(), count);
+ testContents(p.getSorted(), ngram);
+
+ }
+
+ public void testGetSimilarity() {
+ NGramProfile a = new NGramProfile("a", 1, 1);
+ NGramProfile b = new NGramProfile("b", 1, 1);
+
+ a.analyze(new StringBuffer(tokencontent1));
+ b.analyze(new StringBuffer(tokencontent2));
+
+ //because of rounding errors might slightly return different results
+ assertEquals(a.getSimilarity(b), b.getSimilarity(a), 0.0000002);
+
+ }
+
+ public void testExactMatch() {
+ NGramProfile a = new NGramProfile("a", 1, 1);
+
+ a.analyze(new StringBuffer(tokencontent1));
+
+ assertEquals(a.getSimilarity(a), 0, 0);
+
+ }
+
+
+ public void testIO() {
+ //Create profile and set some contents
+ NGramProfile a = new NGramProfile("a", 1, 1);
+ a.analyze(new StringBuffer(this.tokencontent1));
+
+ NGramProfile b = new NGramProfile("a_from_inputstream", 1, 1);
+
+ //save profile
+ ByteArrayOutputStream os = new ByteArrayOutputStream();
+
+ try {
+ a.save(os);
+ os.close();
+ } catch (Exception e) {
+ fail();
+ }
+
+ //load profile
+ InputStream is = new ByteArrayInputStream(os.toByteArray());
+ try {
+ b.load(is);
+ is.close();
+ } catch (Exception e) {
+ fail();
+ }
+
+ //check it
+ testCounts(b.getSorted(), counts1);
+ testContents(b.getSorted(), chars1);
+ }
+
+ private void testContents(List entries, String contents[]) {
+ int c = 0;
+ Iterator i = entries.iterator();
+
+ while (i.hasNext()) {
+ NGramProfile.NGramEntry nge = (NGramProfile.NGramEntry) i.next();
+ assertEquals(contents[c], nge.getSeq().toString());
+ c++;
+ }
+ }
+
+ private void testCounts(List entries, int counts[]) {
+ int c = 0;
+ Iterator i = entries.iterator();
+
+ while (i.hasNext()) {
+ NGramProfile.NGramEntry nge = (NGramProfile.NGramEntry) i.next();
+ System.out.println(nge);
+ assertEquals(counts[c], nge.getCount());
+ c++;
+ }
+ }
+ public void testIdentify() {
+ try {
+ long total = 0;
+ LanguageIdentifier idfr = LanguageIdentifier.getInstance();
+ BufferedReader in = new BufferedReader(new InputStreamReader(
+ this.getClass().getResourceAsStream("test-referencial.txt")));
+ String line = null;
+ while((line = in.readLine()) != null) {
+ String[] tokens = line.split(";");
+ if (!tokens[0].equals("")) {
+ long start = System.currentTimeMillis();
+ // Identify the whole file
+ String lang = idfr.identify(this.getClass().getResourceAsStream(tokens[0]));
+ total += System.currentTimeMillis() - start;
+ assertEquals(tokens[1], lang);
+ // Then, each line of the file...
+ BufferedReader testFile = new BufferedReader(
+ new InputStreamReader(
+ this.getClass().getResourceAsStream(tokens[0])));
+ String testLine = null;
+ while((testLine = testFile.readLine()) != null) {
+ testLine = testLine.trim();
+ if (testLine.length() > 1024) {
+ lang = idfr.identify(testLine);
+ assertEquals(tokens[1], lang);
+ }
+ }
+ testFile.close();
+ }
+ }
+ in.close();
+ System.out.println("Total Time=" + total);
+ } catch(Exception e) {
+ e.printStackTrace();
+ fail(e.toString());
+ }
+ }
+
+}
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/sv.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/sv.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/sv.test (revision 0)
@@ -0,0 +1,108 @@
+Återupptagande av sessionen
+Jag förklarar Europaparlamentets session återupptagen efter avbrottet den 17 december. Jag vill på nytt önska er ett gott nytt år och jag hoppas att ni haft en trevlig semester.
+Som ni kunnat konstatera ägde "den stora år 2000-buggen" aldrig rum. Däremot har invånarna i ett antal av våra medlemsländer drabbats av naturkatastrofer som verkligen varit förskräckliga. Ni har begärt en debatt i ämnet under sammanträdesperiodens kommande dagar. Till dess vill jag att vi, som ett antal kolleger begärt, håller en tyst minut för offren för bl.a. stormarna i de länder i Europeiska unionen som drabbats. Jag ber er resa er för en tyst minut.
+(Parlamentet höll en tyst minut.)
+
+Fru talman! Det gäller en ordningsfråga. Ni känner till från media att det skett en rad bombexplosioner och mord i Sri Lanka. En av de personer som mycket nyligen mördades i Sri Lanka var Kumar Ponnambalam, som besökte Europaparlamentet för bara några månader sedan. Skulle det vara möjligt för er, fru talman, att skriva ett brev till den srilankesiska presidenten i vilket parlamentets beklagande uttrycks över hans och de övriga brutala dödsfallen i Sri Lanka och uppmanar henne att göra allt som står i hennes makt för att få en fredlig lösning på en mycket komplicerad situation?
+
+Ja, herr Evans, jag tror att ett initiativ i den riktning ni just föreslagit skulle vara mycket lämpligt. Om kammaren instämmer skall jag göra som herr Evans föreslagit.
+
+Fru talman! Det gäller en ordningsfråga. Jag skulle vilja ha råd från er vad gäller artikel 143 om avvisning av ett ärende som otillåtligt. Min fråga har att göra med något som kommer att behandlas på torsdag och som jag då kommer att ta upp igen.
+Cunhas betänkande om de fleråriga utvecklingsprogrammen behandlas i parlamentet på torsdag och det innehåller ett förslag i punkt 6 om att något slag av kvoteringspåföljder bör införas för länder som misslyckas med att uppfylla sina årliga mål rörande minskning av flottorna. I betänkandet står det att detta bör göras trots principen om relativ stabilitet. Jag anser att principen om relativ stabilitet är en grundläggande rättsprincip inom den gemensamma fiskeripolitiken, och ett förslag som skulle undergräva den måste betraktas som rättsligt otillåtligt. Jag vill veta om jag kan göra en sådan invändning mot ett betänkande, som alltså inte är ett lagförslag, och om det är något som jag har behörighet att göra på torsdag.
+
+Det är faktiskt just vid det tillfället som ni, om ni vill, kan ta upp denna fråga, dvs. på torsdag innan betänkandet läggs fram.
+
+Fru talman! Under årets första sammanträdesperiod för Europaparlamentet bestämde man dessvärre i Texas i USA att nästa torsdag avrätta en dödsdömd, en ung man på 34 år som vi kan kalla Hicks.
+På uppmaning av en fransk parlamentsledamot, Zimeray, har redan en framställning gjorts, undertecknad av många, bland annat jag själv, men jag uppmanar er, i enlighet med de riktlinjer som Europaparlamentet och hela den europeiska gemenskapen alltid har hållit fast vid, att med all den tyngd ni har i kraft av ert ämbete och den institution ni företräder, uppmana Texas guvernör, Bush, att uppskjuta verkställigheten och att benåda den dömde.
+Detta är helt i linje med de principer som vi alltid har hävdat.
+
+Tack, herr Segni, det skall jag gärna göra. Det ligger faktiskt helt i linje med de ståndpunkter vårt parlament alltid antagit.
+
+Fru talman! Jag vill fästa er uppmärksamhet vid ett fall som parlamentet vid upprepade tillfällen har befattat sig med. Det gäller fallet Alexander Nikitin. Alla gläder vi oss åt att domstolen har friat honom och tydligt visat att tillgängligheten till miljöinformation är en konstitutionell rättighet även i Ryssland. Nu är det emellertid så att han skall åtalas på nytt i och med att allmänne åklagaren överklagar. Vi är medvetna om, vilket vi också - inte minst under förra årets sista plenarsammanträde - har kunnat konstatera i en lång rad beslut, att detta inte enbart är ett juridiskt fall och att det är fel att beskylla Alexander Nikitin för kriminalitet och förräderi, eftersom vi som berörda parter drar nytta av de resultat han har kommit fram till. Resultaten utgör grunden för de europeiska programmen för skydd av Barents hav, och därför ber jag er granska ett utkast till ett brev som skildrar de viktigaste fakta samt att i enlighet med parlamentsbesluten visa Ryssland denna ståndpunkt klart och tydligt.
+
+Ja, fru Schroedter, jag skall mycket gärna granska fakta rörande denna fråga när jag fått ert brev.
+
+Fru talman! Först skulle jag vilja ge er en komplimang för det faktum att ni hållit ert ord och att det nu, under det nya årets första sammanträdesperiod, faktiskt har skett en kraftig utökning av antalet TV-kanaler på våra rum. Men, fru talman, det som jag bad om har inte inträffat. Det finns nu visserligen två finska kanaler och en portugisisk, men det finns fortfarande ingen nederländsk kanal. Jag bad er om en nederländsk kanal, eftersom nederländare också gärna vill ta del av nyheterna varje månad då vi blir förvisade till den här platsen. Jag skulle således på nytt vilja be er att ombesörja att vi också får en nederländsk kanal.
+
+Fru Plooij-van Gorsel! Jag kan tala om för er att frågan finns på föredragningslistan för kvestorernas möte på onsdag. Jag hoppas att den kommer att granskas i en positiv anda.
+
+Fru talman! Kan ni berätta för mig varför detta parlament inte följer den arbetsskyddslagstiftning det faktiskt antar? Varför har det inte genomförts något luftkvalitetstest i denna byggnad efter denna mandatperiods början? Varför har inte arbetsskyddskommittén haft några sammanträden sedan 1998? Varför har det inte skett några brandövningar i parlamentets byggnader i Bryssel eller Strasbourg? Varför finns det inga instruktioner om hur man skall bete sig om det börjar brinna? Varför har inte trapporna byggts om efter den olycka jag råkade ut för? Varför upprätthåller man inte bestämmelserna om rökfria områden? Jag tycker det är skrämmande att vi antar lagstiftning som vi inte själva följer.
+(Applåder)
+
+Fru Lynne! Ni har helt rätt och jag skall kontrollera om allt detta faktiskt inte har gjorts. Jag skall också överlämna problemet till kvestorerna och jag är övertygad om att de är måna om att se till att vi respekterar de regler som vi faktiskt röstat fram.
+
+Fru talman! Díez González och jag har ställt några frågor angående vissa av vice ordförande de Palacios åsikter som återgavs i en spansk dagstidning. De ansvariga har inte tagit med dessa frågor på föredragningslistan, eftersom man ansåg att dessa hade besvarats vid ett tidigare sammanträde.
+Jag ber att man omprövar det beslutet, eftersom så inte är fallet. De frågor som tidigare besvarats handlade om de Palacios inblandning i ett särskilt ärende, inte om de uttalanden som återgavs i dagstidningen ABC den 18 november i fjol.
+
+Kära kollega! Vi skall kontrollera allt detta. Jag erkänner att för närvarande förefaller saker och ting litet oklara. Vi skall alltså se över detta mycket noga så allt blir i sin ordning.
+
+Fru talman! Jag vill veta om det kommer att gå ut ett tydligt budskap från parlamentet under veckan om vårt missnöje rörande dagens beslut om att vägra en förnyelse av vapenembargot mot Indonesien, med hänsyn till att det stora flertalet i detta parlament har stött vapenembargot mot Indonesien? Dagens beslut att inte förnya embargot är oerhört farligt med hänsyn till situationen där. Parlamentet bör alltså sända ut ett budskap, eftersom detta är vad det stora flertalet vill. Det är oansvarigt av EU:s medlemsstater att vägra att förnya embargot. Som olika personer har sagt, är situationen där oerhört turbulent. Det finns faktiskt en risk för en framtida militärkupp. Vi vet inte vad som händer. Så varför skall vapentillverkarna i EU profitera på oskyldiga människors bekostnad?
+(Applåder)
+
+I vilket fall som helst är frågan för närvarande inte föremål för någon begäran om brådskande förfarande på torsdag.
+
+Arbetsplan
+Nästa punkt på föredragningslistan är fastställande av arbetsplanen. Det slutgiltiga förslaget till föredragningslista som utarbetats av talmanskonferensen vid sammanträdet den 13 januari i enlighet med artikel 110 i arbetsordningen har delats ut. För måndag och tisdag har inga ändringar föreslagits.
+Beträffande onsdag:
+Den socialistiska gruppen har begärt att ett uttalande från kommissionen om dess strategiska mål för de fem kommande åren samt om kommissionens administrativa reform skall tas upp.
+Jag skulle vilja att Barón Crespo, som lämnat begäran, uttalar sig för att motivera den, om han vill, naturligtvis. Sedan gör vi som vi brukar: vi lyssnar till en talare för och en talare emot.
+
+Fru talman! Framläggandet av kommission Prodis politiska program för hela mandatperioden bottnar i ett förslag från Europeiska socialdemokratiska partiets grupp som antogs med enhällighet på talmanskonferensen i september samt ett tydligt godkännande från ordförande Prodi som upprepade detta åtagande i sitt anförande i samband med tillträdandet av sitt ämbete.
+Detta åtagande är viktigt, med tanke på att kommissionen är det organ som enligt fördragen har ensam initiativrätt, och det utgör därför grunden till parlamentets politiska och lagstiftande verksamhet de kommande fem åren. Jag vill dessutom, fru talman, påminna om att parlamentet vid två tillfällen under föregående mandatperiod röstade om förtroendet för ordförande Prodi; man röstade på nytt om detta under denna mandatperiod i juli, och sedan, när den nya kommissionen hade påbörjat sitt arbete, gav man i september en förtroenderöst till hela kommissionen. Därför har det funnits tillräckligt mycket tid för kommissionen att förbereda sitt program och för att oss att ta del av detta och redogöra för detta inför medborgarna. Jag vill också påminna om resolutionen av den 15 september, där man rekommenderade att förslaget skulle läggas fram så snart som möjligt.
+Det som hände förra veckan - något som inleddes utanför talmanskonferensen, en konferens som endast utnyttjades för att bestyrka och bekräfta det beslut som fattats utanför ramarna för denna - utgör ett dilemma: antingen är det så att kommissionen inte är i stånd att presentera programmet (i sådant fall bör den klargöra detta. Enligt ordförandens uttalanden kan man presentera programmet. Med tanke på att kommissionen företräds av vice ordförande de Palacio, anser jag att vi innan omröstningen sker bör få veta huruvida kommissionen är beredd att lägga fram programmet, så som man kommit överens om); annars är parlamentet inte i stånd att granska programmet, så som vissa tycks anse. Enligt min uppfattning skulle den sistnämnda hypotesen innebära att vi försummade vårt ansvar som parlament, förutom att man då skulle införa en grundtes, en okänd metod som innebär att de politiska grupperna skriftligen får ta del av kommissionens tankar kring programmet en vecka i förväg i stället för en dag i förväg, som man kommit överens om. Då bör man tänka på att lagstiftningsprogrammet skall debatteras i februari, och därför skulle vi lika gärna kunna avstå från den debatten, för pressen och Internet skulle redan dagen därpå tillkännage programmet för alla medborgare, och det skulle inte längre finnas någon anledning för parlamentet att ägna sig åt frågan.
+Eftersom min grupp anser att parlamentet är till för att lyssna, för att debattera och för att reflektera, anser vi att det inte finns något som rättfärdigar en senareläggning av debatten, och om kommissionen är beredd till det, menar vi att det fortfarande är möjligt att återupprätta det ursprungliga avtalet mellan parlamentet och kommissionen och agera på ett ansvarsfullt sätt gentemot våra medborgare. Därför innebär förslaget från Europeiska socialdemokratiska partiets grupp, som fru talmannen nämnde, att kommission Prodis lagstiftningsprogram läggs fram på onsdag som planerat, och att man inbegriper förslaget om en administrativ reform, för i annat fall kan en paradoxal situation uppstå: å ena sidan vägras kommissionens ordförande, med ursäkten att det inte finns något dokument, rätten att tala i parlamentet, å andra sidan omöjliggörs en debatt om reformen, eftersom parlamentet inte tidigare har fått ta del av dokumenten i fråga. Därför ber jag, fru talman, att ni uppmanar kommissionen att uttala sig och att vi därefter går till omröstning.
+(Applåder från PSE)
+
+Fru talman, ärade kolleger! Jag måste säga att jag är något förvånad över kollegan Barón Crespos agerande när han nu kräver att denna punkt på föredragningslistan flyttas till onsdagen.
+Herr Barón Crespo! Ni kunde inte närvara vid talmanskonferensen förra torsdagen. Det tänker jag inte kritisera: det händer alltid att man har en ställföreträdare. Kollegan Hänsch var där och företrädde er. Vi förde en grundlig debatt på talmanskonferensen. Det var bara er egen grupp som förespråkade det ni nu talar om. Därefter röstade vi. Varje ordförande har ju lika många röster som hans eller hennes grupp har medlemmar. Det röstades på denna punkt. Omröstningen resulterade vad jag kan minnas i följande siffror: 422 röster mot 180, med några få nedlagda röster. Detta betyder att alla grupper, med undantag för de grupplösa - men de är ju heller ingen grupp - var överens, och endast er grupp ansåg att man borde förfara på det sätt som ni har föreslagit här. Alla andra var av en annan åsikt. Sådant blev beslutet.
+Nu vill jag själv säga något i ämnet. Vi hyser förtroende för kommissionen, för Romano Prodi, och en mycket stor majoritet av vår grupp uttalade sitt förtroende för Romano Prodi och kommissionen efter en, som alla vet, svår process. Men vi anser också att vi måste föra en debatt om kommissionens strategi under ordnade former, inte bara utifrån ett muntligt uttalande här i Europaparlamentet utan också från ett dokument som kommissionen har beslutat om och som beskriver programmet för fem år framöver. Något sådant dokument existerar inte!
+(Applåder)
+I februari skall kommissionen lägga fram programmet för år 2000. Vi har sagt att detta går för sig, om kommissionen inte vill göra klart program 2000 redan i januari, då gör vi det i februari. Det har vi sagt ja till. Vi vill ju för den delen inte gräla med kommissionen utan anser att kommission och parlament så långt det är möjligt skall gå samma väg. Men samtidigt är vi som parlament kontrollinstans gentemot kommissionen. Och allt som kommer från kommissionen behöver inte nödvändigtvis vara vår åsikt.
+Jag vill att vi inom grupperna skall kunna förbereda oss på ett klokt sätt inför en debatt om femårsprogrammet. Man kan inte förbereda sig genom att sitta här och lyssna på ett uttalande utan att alls veta vad som ligger bakom ett sådant uttalande. Därför rekommenderar vi - och jag har intrycket att kommissionen likaledes är öppen för den tanken - att debatten om kommissionens långsiktiga arbete fram till år 2000 förs nu i februari - jag hoppas också att kommissionen till dess har kommit överens om ett program att föreslå - och att vi samtidigt i februari kan debattera kommissionens lagstiftningsprogram för år 2000. Det är sålunda även av förnuftiga och sakliga skäl som vi bör debattera bägge programmen samtidigt. Därför tillbakavisar min grupp å det bestämdaste den socialistiska gruppens förslag!
+(Applåder från PPE-DE-gruppen)
+
+Fru talman! Jag vill i första hand klargöra att kommissionen hyser den största respekt för parlamentets beslut, och därmed även för beslutet om fastställandet av arbetsplanen. Vi respekterar således i det avseendet parlamentets beslut. Samtidigt vill jag klargöra att ordförande Prodi har lovat parlamentet ytterligare en debatt, precis som Barón påpekade, förutom den årliga debatten om kommissionens lagstiftningsprogram, en debatt om de viktigaste handlingslinjerna under den kommande femårsperioden, det vill säga under denna mandatperiod.
+Det jag vill säga, fru talman, är att man i den överenskommelse som uppnåddes i september, gjorde en åtskillnad mellan den debatten och framställandet av kommissionens årliga lagstiftningsprogram. Och jag vill också, fru talman, säga att vi från kommissionens sida är förberedda och färdiga för denna debatt när än det må vara, att vi är redo att hålla debatten denna vecka, så som man i princip avtalade, med tanke på att utkastet redan har presenterats i ett anförande inför de parlamentariska grupperna.
+Därför, fru talman, vill jag än en gång påpeka att vi för vår del har diskuterat igenom åtgärdsprogrammet för de kommande fem åren, och att vi är redo att, när som helst då parlamentet beslutar det, - den här veckan om man bestämmer sig för det - komma och presentera programmet för de kommande fem åren, och sedan nästa månad, programmet för år 2000, precis som avtalat.
+
+Jag föreslår att vi röstar om begäran från den socialistiska gruppen att på nytt föra upp kommissionens uttalande om dess strategiska mål på föredragningslistan.
+(Parlamentet avslog begäran.) Talmannen. Beträffande onsdagen har jag också mottagit ett annat förslag beträffande den muntliga frågan om kapitalskatt. PPE-DE-gruppen begär att denna punkt skall strykas från föredragningslistan.
+Vill någon kollega begära ordet för gruppens räkning och motivera denna begäran?
+
+Fru talman! Eftersom jag hör att det skrattas bland socialisterna: man har sagt mig att även vida kretsar inom den socialistiska gruppen gärna vill se den här punkten avförd från föredragningslistan, eftersom det vid omröstningen på talmanskonferensen saknades votum för berörda kolleger i den socialistiska arbetsgruppen. Jag vet inte huruvida denna information stämmer, men vi i PPE-DE-gruppen vore i alla fall tacksamma ifall punkten ströks, då ju parlamentet redan har befattat sig med frågan flera gånger. Det finns också beslut fattade mot en sådan skatt. Därför yrkar min grupp på att punkten avförs från föredragningslistan.
+
+Tack, herr Poettering.
+Vi skall nu lyssna till Wurtz som skall uttala sig emot denna begäran.
+
+Fru talman! Jag skulle till att börja med vilja understryka Poetterings bristande logik. Han har just läxat upp den socialistiska gruppen för att den ändrat sig när det gäller ett beslut som fattats med mycket liten marginal i talmanskonferensen. Men han gör samma sak själv. Vi diskuterade och var eniga, utom PPE-gruppen och den liberala gruppen, och jag noterade t.o.m., det minns ni säkert kära ordförandekolleger, att frågan inte handlar om huruvida ni är för eller emot Todinskatten, utan om ni vågar höra vad kommissionen och rådet tycker om den. Det är inte för mycket begärt. Jag upprepar därför förslaget att behålla denna muntliga fråga till kommissionen och rådet för att en gång för alla få veta vilken inställning dessa två instanser har till denna relativt blygsamma begäran, som ändå skulle utgöra en viktig signal till allmänheten, särskilt med tanke på den oro som uppstod efter den misslyckade konferensen i Seattle.
+
+Vi skall rösta om begäran från PPE-DE-gruppen som syftar till att stryka den muntliga frågan om kapitalskatt från föredragningslistan.
+(Parlamentet avslog begäran med 164 röster för, 166 emot. 7 ledamöter avstod från att rösta.)
+
+Fru talman! Jag skulle vilja tacka Poettering för att han just gjort reklam för denna debatt. Tack.
+
+Fru talman! Jag undrar om även min röst har räknats, trots att den inte kunde avges på elektronisk väg, eftersom jag inte har något kort? Jag röstade "för".
+
+Om man lägger till de två kolleger som yttrat sig blir resultatet...
+
+Fru talman! Ordförandeskapet har redan meddelat resultatet från omröstningen. Det finns inget utrymme för några ändringar.
+(Applåder)
+
+Kära kolleger! Ännu en gång vill jag påpeka att alla måste ha sitt kort på måndagen. Det är tydligt att vi har ett problem här. Jag måste därför fatta ett beslut.
+Jag har också glömt mitt kort och jag skulle ha röstat emot. Jag anser därför att den muntliga frågan kvarstår på föredragningslistan.
+(Applåder) Det är sista gången vi tar hänsyn till att ni glömt korten. Jag hoppas att alla har förstått och vi skall se till att alla får veta det.
+(Applåder)
+Ja, den munliga frågan kvarstår på föredragningslistan och, ja, talmannen har rätt att rösta, liksom hon har rätt att också glömma sitt kort.
+Vi fortsätter nu med övriga ändringar i föredragningslistan.
+
+Fru talman! Under den tidigare omröstningen - och jag kommer att följa ert utslag i denna fråga - rörande frågan om kommissionens strategiska plan, sade jag att jag ville uttala mig före omröstningen på min grupps vägnar. Så blev inte fallet. Jag skulle uppskatta om jag vid denna punkts avslutande kunde få avge en röstförklaring på min grupps vägnar. Detta är en viktig fråga. Det skulle vara användbart för kammarens räkning att upplysa om hur folk uppfattar vad vi just gjort mot bakgrund av deras egen politiska analys.
+
+Fru talman! Jag skall inte ta upp debatten på nytt, men även jag hade begärt ordet för att ta ställning till herr Barón Crespos begäran. Ni lät mig aldrig komma till tals. Det beklagar jag, men omröstningen har genomförts, beslutet har fattats, alltså får det vara.
+
+Jag är ledsen, herr Hänsch och herr Cox, jag såg inte att ni hade begärt ordet. Jag tror ändå att ståndpunkterna är tydliga och de kommer att bekräftas i protokollet. När vi i morgon justerar protokollet från dagens sammanträde kan de kolleger, som då anser att ståndpunkterna inte förklarats tillräckligt tydligt, begära ändringar. Jag tror att det är ett bra sätt. Naturligtvis kommer man i protokollet från morgondagens sammanträde att ta hänsyn till alla kompletterande förklaringar. Jag tror att det är bättre än att nu genomföra röstförklaringar som kommer att leda mycket långt. Vad säger ni om det, herr Cox och herr Hänsch?
+
+Fru talman! Om omröstningsregistreringen på ett korrekt sätt visar hur min grupp röstade, skall jag och kan jag inte protestera mot denna. Om ert utslag innebär att jag inte kan avge en röstförklaring, accepterar jag detta men med reservation.
+
+Vi skall alltså vara mycket noggranna vid upprättandet av protokollet. Det är vi för övrigt alltid. Om det inte återger ståndpunkterna tillfredsställande, kan vi eventuellt ändra i det.
+(Arbetsplanen fastställdes med dessa ändringar.)
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/test-referencial.txt
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/test-referencial.txt (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/test-referencial.txt (revision 0)
@@ -0,0 +1,10 @@
+da.test;da
+de.test;de
+el.test;el
+en.test;en
+es.test;es
+fi.test;fi
+fr.test;fr
+it.test;it
+nl.test;nl
+pt.test;pt
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/fi.test
===================================================================
--- src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/fi.test (revision 0)
+++ src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/fi.test (revision 0)
@@ -0,0 +1,106 @@
+Istuntokauden uudelleenavaaminen
+ Julistan perjantaina joulukuun 17. päivänä keskeytetyn Euroopan parlamentin istunnon avatuksi ja esitän vielä kerran vilpittömän toiveeni siitä, että teillä olisi ollut oikein mukava joululoma.
+Kuten olette varmaan saattaneet huomata, vuodenvaihteeseen 2000 povattuja suuria tietokoneongelmia ei ilmennytkään. Sen sijaan todella kauheat luonnonkatastrofit koettelivat kansalaisia joissakin unionimme maissa. Te olette esittäneet toiveen, että tästä asiasta keskusteltaisiin lähipäivinä tämän istuntojakson aikana. Sillä välin toivoisin, kuten useampi kollega on minulle esittänytkin, että viettäisimme minuutin hiljaisuuden kaikkien niiden uhrien muistoksi, jotka saivat surmansa useita Euroopan unionin maita koetelleissa myrskyissä. Kehotan, että nousette seisomaan tämän minuutin hiljaisuuden ajaksi
+(Parlamentti vietti seisaallaan minuutin hiljaisuuden.)
+
+Arvoisa puhemies, käytän työjärjestyspuheenvuoron. Olette varmaan saaneet tietoonne lehdistön ja television kautta, että Sri Lankassa on sattunut useita kuolemaan johtaneita pommi-iskuja. Näiden Sri Lankassa aivan äskettäin surmansa saaneiden ihmisten joukossa on Kumar Ponnambalam, joka vieraili parlamentissa vain pari kuukautta sitten. Kävisikö teille, arvoisa puhemies, että kirjoittaisitte Sri Lankan presidentille kirjeen, jossa välittäisitte surunvalittelut parlamentin puolesta Ponnambalanin kuoleman ja muiden Sri Lankassa sattuneiden väkivaltaisten kuolemantapausten johdosta ja jossa pyytäisitte presidenttiä tekemään kaikkensa, jotta tähän hyvin vaikeaan tilanteeseen löydettäisiin rauhanomainen sovitteluratkaisu?
+
+ Kyllä, jäsen Evans, mielestäni äsken ehdottamanne suuntainen aloite olisi varsin oikeaan osuva. Jos parlamentin jäsenet kannattavat sitä, teen niin kuin jäsen Evans ehdotti.
+
+Arvoisa puhemies, käytän työjärjestyspuheenvuoron. Haluaisin, että kertoisitte mielipiteenne työjärjestyksen 143 artiklasta, joka koskee sitä, milloin jotakin asiaa ei oteta käsiteltäväksi. Kysymykseni liittyy erääseen seikkaan, jota käsitellään torstaina ja jonka otan silloin taas esille.
+Cunhan monivuotisia ohjausohjelmia koskevaa mietintöä käsitellään parlamentissa torstaina, ja sen 6 kohtaan sisältyy ehdotus, jonka mukaan niiden maiden kohdalla, jotka eivät suoriudu vuosittaisista laivueita koskevista supistamistavoitteistaan, otetaan käyttöön eräänlaisia kiintiöiden vähentämistä tarkoittavia rangaistuksia. Mietinnössä sanotaan, että näin olisi tehtävä suhteellisen vakauden periaatteesta huolimatta. Uskon, että suhteellisen vakauden periaate on perusluonteinen oikeudellinen periaate yhteisen kalastuspolitiikan alalla ja että ehdotusta, jossa sitä horjutetaan, olisi lainsäädännöllisesti mahdoton hyväksyä. Haluaisin tietää, onko mahdollista esittää tällainen vastalause, jonka kohteena on pelkkä mietintö eikä lakiehdotus, ja onko minulla valtuuksia esittää tällainen vastalause torstaina.
+
+ Te voitte tosiaankin juuri silloin tehdä tämän esityksen, mikäli sitä haluatte, eli torstaina ennen mietinnön käsittelyn alkamista.
+
+Arvoisa puhemies, samanaikaisesti Euroopan parlamentin tämän vuoden ensimmäisen istuntojakson kanssa Texasissa Yhdysvalloissa päätettiin, että eräs nuori - 34-vuotias - kuolemaantuomittu, nimeltään Hicks, teloitetaan valitettavasti ensi perjantaina.
+Ranskalaisen parlamentin jäsenen Zimerayn pyynnöstä on esitetty vetoomus, jonka monet ovat allekirjoittaneet, ja olen itse yksi heistä, mutta pyydän, että te Euroopan parlamentin ja koko Euroopan yhteisön johdonmukaisesti osoittaman kannan mukaisesti otatte virkanne suoman ja edustamanne toimielimen arvovallan voimin yhteyttä Texasin osavaltion johtajaan, kuvernööri Bushiin, jolla on valtuudet kumota kuolemantuomio ja armahtaa kuolemaantuomittu.
+Ja kaikki tämä niiden periaatteiden mukaisesti, joita olemme aina puolustaneet.
+
+ Kiitos, jäsen Segni, teen sen oikein mielelläni. Se on tosiaankin täysin niiden periaatteiden mukaista, joita parlamentti on aina puolustanut.
+
+Arvoisa puhemies, haluaisin kiinnittää huomionne tapaukseen, jota tämä parlamentti on käsitellyt toistuvasti. Se on tapaus Aleksandr Nikitin. Me kaikki täällä parlamentissa olemme iloisia siitä, että oikeus vapautti hänet ja teki selväksi, että ympäristöä koskevien tietojen saaminen on perustuslaillinen oikeus myös Venäjällä. Tilanne on nyt kuitenkin se, että hän on joutunut uudelleen syytteeseen, koska yleinen syyttäjä valittaa oikeuden päätöksestä. Me tiedämme ja olemme todenneet sen todellakin erittäin monissa päätöslauselmissa - nimenomaan viime vuoden viimeisessä täysistunnossa -, että tämä ei ole pelkästään oikeustapaus ja on väärin syyttää Aleksandr Nikitiniä rikollisuudesta ja petoksesta, koska me asianosaisina hyödymme hänen tuloksistaan. Nämä tulokset muodostavat pohjan eurooppalaisille Barentsinmeren suojeluohjelmille, ja pyydän teitä siksi tarkastelemaan huolellisesti kirjeluonnosta, jossa selitetään tärkeimmät tosiasiat, ja tekemään tämän kannan selväksi Venäjällä parlamentin päätösten hengessä.
+
+ Kyllä jäsen Schroedter, saatuani kirjeenne otan varsin mielelläni selvää tähän kysymykseen liittyvistä seikoista.
+
+Arvoisa puhemies, haluaisin aluksi kiittää teitä siitä, että olette pitänyt sananne ja että nyt uuden vuoden ensimmäisen istuntojakson aikana huoneissamme näkyvien televisiokanavien määrä on todellakin kasvanut valtavasti. Arvoisa puhemies, se, mitä minä pyysin, ei ole kuitenkaan toteutunut. Nyt näkyvissä on kaksi suomalaista kanavaa ja yksi portugalilainen kanava, ja minä pyysin teiltä alankomaalaista kanavaa, koska myös alankomaalaiset haluavat seurata uutisia joka kuukausi, kun meidät lähetetään tänne karkotuspaikkaan. Haluaisin pyytää teitä vielä kerran huolehtimaan siitä, että me saamme myös alankomaalaisen kanavan.
+
+ Jäsen Plooij-van Gorsel, voin kertoa, että kyseinen asia on kvestorien ensi keskiviikon kokouksen esityslistalla. Toivon, että sitä käsitellään myönteisessä hengessä.
+
+Arvoisa puhemies, voitteko kertoa minulle, miksi parlamentti ei noudata terveyttä ja turvallisuutta koskevaa lainsäädäntöä, jonka se oikeastaan itse hyväksyy? Miksei juuri tämän rakennuksen ilmanlaatua ole testattu sinä aikana, kun olemme olleet jäseniä? Miksi terveys- ja turvallisuusasioista vastaava komitea ei ole kokoontunut vuoden 1998 jälkeen? Miksi parlamentin Brysselin tiloissa tai Strasbourgin tiloissa ei ole järjestetty paloharjoituksia? Miksi tulipalon varalta ei ole annettu ohjeita? Miksi portaikossa ei ole tehty parannuksia minulle sattuneen onnettomuuden jälkeen? Miksi "tupakointi kielletty" -alueita ei ole pantu täytäntöön? On todella noloa, että hyväksymme lakeja emmekä noudata niitä itse.
+
+Jäsen Lynne, te olette täysin oikeassa, ja aion tarkistaa, eikö kaikkea tätä todellakaan ole tehty. Toimitan myös tämän ongelman kvestorikollegion käsiteltäväksi ja olen varma, että kvestoreillemme on erittäin tärkeää toimia niin, että noudatamme sellaista lainsäädäntöä, jonka olemme itse hyväksyneet.
+
+Arvoisa puhemies, Díez González ja minä olimme esittäneet muutamia kysymyksiä, jotka koskivat tiettyjä komission varapuheenjohtaja de Palacion lausuntoja, jotka julkaistiin eräässä espanjalaisessa päivälehdessä. Toimivaltaiset yksiköt eivät ole ottaneet kysymyksiä esityslistalle, koska yksiköiden mukaan niihin on jo vastattu aiemmalla istuntojaksolla.
+Pyydän, että tämä päätös perutaan, sillä asia ei ole niin. Ne kysymykset, joihin aiemmin vastattiin, liittyvät komission varapuheenjohtaja De Palacion puheenvuoroon eräässä asiassa, eikä näihin viime marraskuun 18. päivänä ABC-lehdessä julkaistuihin lausuntoihin.
+
+Hyvä kollega, tarkistamme asian. Minun täytyy myöntää, että tällä hetkellä asiat vaikuttavat minusta hieman sekavilta. Niinpä käymme asian erittäin tarkasti läpi, jotta kaikki saadaan hyvälle tolalle.
+
+Arvoisa puhemies, haluaisin tietää, lähettääkö parlamentti tällä viikolla ulkomaailmaan selvän viestin siitä, kuinka tyytymättömiä olemme tämänpäiväiseen päätökseen, jonka mukaan aseiden vientikieltoa Indonesiaan ei jatketa, varsinkin, jos otamme huomioon, että parlamentin valtaenemmistö on aiemmin tukenut aseiden vientikieltoa Indonesiaan? Tämänpäiväinen päätös olla jatkamatta vientikieltoa on erittäin vaarallinen, jos otamme huomioon Indonesian tilanteen. Näin ollen parlamentin olisi lähetettävä tällainen viesti, sillä valtaenemmistö toivoo sitä. On vastuutonta, että EU:n jäsenvaltiot kieltäytyvät jatkamasta aseiden vientikieltoa. Kuten monet ovat kertoneet, tilanne on Indonesiassa äärimmäisen räjähdysaltis. Vaarana todellakin on tuleva sotilasvallankaappaus. Me emme tiedä, mitä tapahtuu. Miksi siis EU:n asevalmistajien olisi tehtävä voittoa viattomien ihmisten kustannuksella?
+
+Joka tapauksessa, tämä kysymys ei ole toistaiseksi torstain ajankohtaiskeskustelun aiheiden joukossa.
+
+Käsittelyjärjestys
+Esityslistalla on seuraavana lopullisen esityslistaluonnoksen käsittely siinä muodossa kuin puheenjohtajakokous torstaina 13. tammikuuta työjärjestyksen 110 artiklan mukaisesti sen laati. Maanantain ja tiistain osalta minulle ei ole ehdotettu muutoksia.
+Keskiviikon osalta:
+Sosialistiryhmä pyytää, että esityslistalle otetaan alunperin esityslistaluonnokseen merkitty komission julkilausuma sen strategisista tavoitteista seuraavien viiden vuoden ajaksi sekä komission hallinnollisesta uudistuksesta.
+Toivoisin, että jäsen Barón Crespo, pyynnön esittäjä, käyttäisi puheenvuoron ja perustelisi pyyntönsä, mutta tietenkin vain, mikäli hän niin haluaa. Sen jälkeen teemme, kuten tapanamme on: kuulemme yhden puheenvuoron puolesta ja yhden vastaan.
+
+Arvoisa puhemies, Prodin johtaman komission koko toimikauden kattavan poliittisen ohjelman esittely oli alun perin Euroopan parlamentin sosiaalidemokraattisen puolueen ryhmän ehdotus, ja se hyväksyttiin yksimielisesti syyskuun puheenjohtajakokouksessa, ja samoin komission puheenjohtaja Prodi antoi sille selvän hyväksyntänsä ja toisti nimityksensä yhteydessä pitämässään puheessa sitoutumistaan siihen.
+Tällä sitoutumisella on merkitystä siinä mielessä, että komissiolla on elimenä perustamissopimusten mukaisesti yksinoikeus tehdä aloitteita, ja siksi komissio määrää sen, millaiseksi parlamentin poliittinen ja lainsäädännöllinen toiminta viiden seuraavan vuoden aikana pohjimmiltaan muotoutuu. Arvoisa puhemies, muistuttaisin lisäksi siitä, että parlamentti antoi edellisellä vaalikaudella kaksi kertaa luottamuslauseen puheenjohtaja Prodille; tällä vaalikaudella luottamuslause annettiin uudelleen heinäkuussa ja sen jälkeen vielä kerran uuden komission astuessa virkaansa, jolloin parlamentti äänesti syyskuussa koko komissiolle annettavasta luottamuslauseesta. Siksi on jo mennyt riittävästi aikaa, jotta komissio on voinut laatia ohjelmansa ja jotta mekin voimme tutustua siihen ja selittää sen kansalaisille. Tässä mielessä palautan mieliin syyskuun 15. päivän päätöslauselman, jossa suositeltiin ehdotuksen esittämistä mahdollisimman pikaisesti.
+Viime viikolla sattuneet asiat jotka saivat alkunsa puheenjohtajakokouksen yhteydessä, jolloin sitä käytettiin vain siihen, että sen ulkopuolella tehdyt päätökset voitaisiin vahvistaa ja sinetöidä ovat johtaneet pulmalliseen tilanteeseen: joko komissio ei pysty esittelemään tätä ohjelmaa (missä tapauksessa komission olisi ilmoitettava se. Komission puheenjohtajan puheiden perusteella komissio pystyykin siihen. Koska komissiota edustaa varapuheenjohtaja de Palacio, luulen, että ennen äänestämistä olisi hyvä tietää komission tilanne eli se, pystyykö komissio esittelemään ohjelman niin kuin sovittiin); tai sitten parlamentti ei pysty käsittelemään tätä ohjelmaa, kuten jotkut näyttävät esittävän. Mielestäni tämä toinen olettamus merkitsisi sitä, että luopuisimme meille parlamenttina kuuluvista velvollisuuksistamme ja lisäksi sitä, että otettaisiin käyttöön omaperäinen teesi ja aivan uudenlainen menetelmä, joka tarkoittaisi sitä, että poliittisille ryhmille annetaan kirjallisessa muodossa tiedoksi komission ohjelmalliset aiheet viikkoa aikaisemmin eikä päivää aikaisemmin, kuten oli sovittu näin varsinkin, jos otetaan huomioon se, että lainsäädäntöohjelmasta keskustellaan helmikuussa, ja näin ollen voimmekin luopua koko keskustelusta, sillä seuraavana päivänä lehdistö ja Internet ovat jo välittäneet tiedon kaikille kansalaisille, eikä parlamentilla ole enää syytä puuttua asiaan.
+Koska ryhmäni on sitä mieltä, että parlamentti on olemassa siksi, että siellä voidaan pohtia asioita, kuunnella ja keskustella, käsityksemme on, että tätä viivästymistä ei voida perustella mitenkään, ja jos komissio pystyy ohjelman esittämään, mielestämme ehdimme hyvin palata alkuperäiseen parlamentin ja komission väliseen sopimukseen ja edetä vastuullisesti kansalaistemme silmissä. Siksi Euroopan parlamentin sosiaalidemokraattisen puolueen ryhmän ehdotus on te myös mainitsitte sen , että keskiviikkona pidetään Prodin komission koko toimikauden ohjelman esittely niin, että tähän ohjelmaan sisältyy myös hallinnollinen uudistussuunnitelma, sillä saatamme joutua paradoksaaliseen tilanteeseen, jos näin ei käy: sen varjolla, että tekstiä ei ole, komission puheenjohtajalta viedään oikeus puhua parlamentille, ja toisaalta pidettäisiin sellainen uudistuksia koskeva keskustelu, jossa parlamentti ei tuntisi etukäteen pohjana olevaa tekstiä. Siksi toivon, että te, arvoisa puhemies, pyytäisitte komissiota ilmoittamaan komission tämänhetkisen kannan, minkä jälkeen toimitettaisiin äänestys.
+(Suosionosoituksia PSE-ryhmältä)
+
+Arvoisa puhemies, hyvät kollegat, olen kaikesta huolimatta hieman hämmästynyt kollega Barón Crespon menettelystä, sillä hän vaatii nyt tämän esityslistan kohdan ottamista keskiviikon istunnon esityslistalle.
+Hyvä kollega Barón Crespo, teillä ei ollut mahdollisuutta olla läsnä viime torstain puheenjohtajakokouksessa. En kritisoi sitä, sillä aina silloin tällöin käy niin, että annamme jonkun toisen edustaa itseämme. Kollega Hänsch edusti teitä siellä. Me keskustelimme tästä asiasta puheenjohtajakokouksessa seikkaperäisesti. Vain teidän ryhmänne puolsi sitä, mitä te nyt ehdotatte. Äänestimme asiasta keskustelun jälkeen. Jokaisella puheenjohtajallahan on yhtä paljon ääniä kuin hänen ryhmässään on jäseniä. Tästä kohdasta toimitettiin siis äänestys. Sen tulos oli muistaakseni seuraavanlainen: 422-180 muutamien harvojen pidättäytyessä äänestämästä. Se tarkoittaa, että kaikki ryhmät sitoutumattomia jäseniä lukuun ottamatta - mutta hehän eivät olekaan mitään ryhmiä - olivat yksimielisiä ja vain teidän ryhmänne kannatti sellaista menettelyä, jota te olette täällä ehdottanut. Kaikki muut olivat eri mieltä. Tämä oli puheenjohtajakokouksen päätös.
+Nyt haluaisin sanoa jotakin itse asiasta. Me luotamme komissioon ja Romano Prodiin, ja ryhmämme hyvin suuri enemmistö antoi vaikean prosessin jälkeen, kuten me kaikki tiedämme, luottamuslauseen Romano Prodille ja komissiolle. Me olemme kuitenkin myös sitä mieltä, että meidän on keskusteltava tästä komission strategiasta asianmukaisessa menettelyssä ei pelkästään komission täällä Euroopan parlamentissa esittämän suullisen tiedonannon pohjalta vaan myös sen asiakirjan pohjalta, josta on päätetty komissiossa ja jossa selostetaan tätä seuraavien viiden vuoden ohjelmaa. Sellaista asiakirjaa ei ole olemassa!
+
+Komissio esittää vuoden 2000 ohjelman helmikuussa. Me olemme sanoneet, hyvä on, jos komissio ei halua tehdä vuoden 2000 ohjelmaa vielä tammikuussa, me teemme sen sitten helmikuussa. Olemme hyväksyneet sen. Mehän emme halua sinänsä mitään riitaa komission kanssa, vaan olemme sitä mieltä, että komission ja parlamentin on kuljettava yhteistä tietä, jos se nimittäin on mahdollista. Me parlamenttina toimimme kuitenkin myös komission valvojana. Eikä meidän tarvitse olla samaa mieltä kaikesta, mitä komissio esittää.
+Haluaisin, että voimme valmistautua viisivuotisohjelmasta käytävään keskusteluun poliittisissa ryhmissä järkevällä tavalla. Se ei ole mahdollista, jos täällä kuullaan julkilausuma tietämättä lainkaan, mitä se sisältää. Suosittelemme siksi - ja minun vaikutelmani on, että komissio on myös vastaanottavainen tälle ajatukselle -, että keskustelemme helmikuussa komission pitkäaikaisesta vuoteen 2005 ulottuvasta ohjelmasta - toivon komission pääsevän siihen mennessä yhteisymmärrykseen myös ohjelmasta, jonka se esittää meille - ja että käymme samaan aikaan helmikuussa myös keskustelua komission vuoden 2000 lainsäädäntöohjelmasta. Tämä on siis myös asiayhteys, jonka takia on järkevää keskustella molemmista ohjelmista yhdessä. Ryhmäni hylkää siksi ehdottomasti sosialistiryhmän ehdotuksen!
+(Suosionosoituksia PPE-DE-ryhmältä)
+
+. (ES) Arvoisa puhemies, haluan tehdä hyvin selväksi, että komissio pitää ilman muuta parlamentin päätöksiä mahdollisimman suuressa arvossa, ja sen myötä arvostaa myös esityslistaa. Siksi kunnioitamme sitä, mikä on tässä mielessä parlamentin päätettävissä.
+Haluaisin myös tehdä selväksi, että puheenjohtaja Prodi lupasi parlamentille, että tämä uusi keskustelu otetaan esityslistalle, mistä jäsen Barón Crespo muistutti, ja että tämä uusi keskustelu käydään komission lainsäädäntöohjelmasta käytävän vuosikeskustelun lisäksi ja siinä käsitellään seuraavan viisivuotiskauden, eli tämän toimikauden, suuria toimintalinjoja.
+Arvoisa puhemies, haluaisin sanoa, että tämä keskustelu poikkeaa syyskuussa tehdyllä sopimuksella komission lainsäädäntöohjelman vuosittaisesta esittelystä. Ja haluaisin sanoa, arvoisa puhemies, että komission puolesta olemme valmistautuneet ja valmiita käymään tämän keskustelun, kun se sopii muille, ja että olemme valmiita käymään sen tällä viikolla, kuten alun perin oli sovittu, ja voimme lähteä myös siitä, että se edeltävänä päivänä esitellään parlamentin ryhmille.
+Arvoisa puhemies, niinpä haluan toistaa, että omasta puolestamme olemme keskustelleet seuraavan viisivuotiskauden toimintasuunnitelmasta ja että olemme valmiit, kun parlamentti niin päättää tällä samalla viikolla, jos se on parlamentin päätös esittelemään parlamentille tämän viisivuotisohjelman ja ensi kuussa ohjelman vuodelle 2000, kuten oli nimenomaan sovittu.
+
+Ehdotan, että pidämme äänestyksen sosialistiryhmän pyynnöstä, jolla pyritään merkitsemään esityslistalle uudelleen komission julkilausuma komission strategisista tavoitteista.
+(Parlamentti hylkäsi pyynnön.) Puhemies. Edelleen keskiviikon istunnon osalta minulla on toinenkin ehdotus, joka liittyy pääomaveroa koskevaan suulliseen kysymykseen. PPE-DE-ryhmä pyytää tämän kohdan poistamista esityslistalta.
+Haluaako joku kollegoista käyttää puheenvuoron ryhmän puolesta ja perustella tämän pyynnön?
+
+Arvoisa puhemies, koska kuulen sosialistiryhmän keskuudesta hieman naurua - minulle sanottiin, että myös monet sosialistiryhmän jäsenistä haluavat mielellään poistaa tämän kohdan esityslistalta, koska puheenjohtajakokouksen äänestyksessä ei ollut käytettävissä sosialistiryhmän asiasta vastaavien jäsenten työryhmän äänestystulosta. En tiedä, pitääkö tämä tieto paikkansa, mutta me PPE-DE-ryhmänä olisimme joka tapauksessa kiitollisia, jos tämä kohta poistettaisiin esityslistalta, koska parlamentti on käsitellyt tätä asiaa jo useita kertoja. Tällaista veroa vastaan on tehty myös päätöksiä. Ryhmäni pyytää siksi tämän kohdan poistamista esityslistalta.
+
+Kiitos, jäsen Poettering.
+Nyt kuuntelemme jäsen Wurtzia, joka puhuu tätä pyyntöä vastaan.
+
+Arvoisa puhemies, haluaisin ensiksi painottaa jäsen Poetteringin epäloogisuutta. Äsken hän läksytti sosialistiryhmää, koska ryhmä olisi perunut puheenjohtajakokouksessa tehdyn äärimmäisen selkeän päätöksen. Nyt hän toimii itse samoin. Keskustelimme ja olimme asiasta yksimielisiä PPE-ryhmää ja liberaaliryhmää lukuun ottamatta, ja silloin jopa huomautin te, hyvät puheenjohtajakollegani varmaan muistatte sen , että kyse ei ole siitä, oletteko te ns. Tobin-veroa vastaan vai ette, vaan siitä, rohkenetteko ymmärtää, mitä mieltä komissio ja neuvosto siitä ovat. Tämä ei ole liikaa vaadittu. Näin ollen pidän kiinni ehdotuksesta, jonka mukaan säilytämme tämän komissiolle ja neuvostolle esitettävän suullisen kysymyksen, jotta saamme vihdoin tietää näiden kahden tahon kannan tästä suhteellisen vaatimattomasta ehdotuksesta, joka kuitenkin merkitsisi tärkeää signaalia yleisen mielipiteen suuntaan varsinkin niiden tunteiden jälkeen, joita Seattlen huippukokouksen epäonnistuminen herätti.
+
+ Äänestämme PPE-DE-ryhmän pyynnöstä, jolla pyritään säilyttämään esityslistalla pääomaveroa koskeva suullinen kysymys.
+(Parlamentti hylkäsi pyynnön: 164 puolesta, 166 vastaan ja 7 tyhjää.)
+
+Arvoisa puhemies, haluaisin kiittää jäsen Poetteringia tästä mainosiskusta, jonka hän juuri järjesti kyseiselle keskustelulle. Kiitos.
+
+Arvoisa puhemies, onko ääneni otettu huomioon, vaikka se ei sähköisesti mennytkään läpi, sillä minulla ei ole äänestyskorttia? Äänestin puolesta.
+
+Jos lisäämmekin molempien ilmoittautuneiden kollegojen puheet, saamme oikeastaan tulokseksi...
+
+Arvoisa puhemies, äänestystuloshan on julistettu. Muutoksia ei voi tehdä.
+
+ Hyvät kollegat, toistan vielä kerran, että jokaisella on oltava äänestyskorttinsa maanantaisin. Meillä on siinä asiassa näköjään ongelmia. Näin ollen minun on tehtävä päätös.
+Myös minä unohdin äänestyskorttini ja olisin äänestänyt vastaan. Katson siis, että suullinen kysymys säilytetään esityslistalla.
+Tämä on viimeinen kerta, kun otamme huomioon äänestyskorttinsa unohtaneiden jäsenten äänet. Tulkoon tämä varsin selväksi ja tehtäköön se tiettäväksi.
+(Suosionosoituksia)
+Kyllä, suullinen kysymys säilyy esityslistalla, ja kyllä, puhemiehelläkin on oikeus äänestää, kuten hänellä on myös oikeus unohtaa äänestyskorttinsa.
+Jatkamme muiden esityslistalle ehdotettujen muutosten käsittelyä.
+
+Arvoisa puhemies, aiemmassa äänestyksessä ja aion noudattaa sitä, mitä asiasta sanotte , joka koski komission strategista suunnitelmaa, ilmoitin haluavani puhua ennen äänestystä ryhmäni puolesta. Näin ei käynyt. Olisin kiitollinen, jos saisin mahdollisuuden antaa äänestysselityksen ryhmäni puolesta sen jälkeen, kun tämä asia on saatu käsiteltyä. Tämä on tärkeä asia. Olisi parlamentille eduksi, että jäsenet voisivat ilmaista omien poliittisten analyysiensa valossa, miten he suhtautuvat siihen, mitä olemme juuri saaneet aikaiseksi.
+
+Arvoisa puhemies, en halua avata keskustelua uudelleen, mutta myös minä pyysin puheenvuoroa ottaakseni kantaa Barón Crespon pyyntöön. Te ette pyytänyt myöskään minua puhumaan. Pahoittelen sitä, mutta äänestys on toimitettu ja päätös tehty, joten antakaamme asian olla.
+
+ Olen pahoillani, jäsen Hänsch ja jäsen Cox, en nähnyt, että pyysitte puheenvuoroa. Näin ollen uskon, että kannat ovat varsin hyvin selvillä ja että ne kirjataan pöytäkirjaan. Kun huomenna hyväksymme tämänpäiväisen istunnon pöytäkirjan, ne kollegat, joiden mielestä jotakin kantaa ei ole selitetty riittävän hyvin, voivat pyytää muutoksia. Minusta tämä on hyvä tapa. Tietenkin huomisen istunnon pöytäkirjassa otetaan kaikki täydentävät selitykset huomioon. Uskoakseni tämä on parempi tapa kuin se, että ryhtyisimme aikaa vieviin äänestysselityksiin nyt. Jäsen Cox ja jäsen Hänsch, sopiiko tämä teille?
+
+Arvoisa puhemies, mikäli pöytäkirjaan on kirjattu oikein, miten ryhmäni äänesti, en aio enkä voikaan vastustaa sitä. Jos päätöksenne on, että en voi antaa äänestysselitystä, hyväksyn sen, mutta tietyin varauksin.
+
+ Aiomme siis laatia pöytäkirjan hyvin tarkasti. Niinhän me oikeastaan teemme aina. Jos kannat eivät tule pöytäkirjasta kunnolla ilmi, voimme tarvittaessa korjata asian.
+(Käsittelyjärjestys vahvistettiin näin muutettuna.)
+
Index: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/el.test
===================================================================
Cannot display: file marked as a binary type.
svn:mime-type = application/octet-stream
Property changes on: src/plugin/languageidentifier/src/test/org/apache/nutch/analysis/lang/el.test
___________________________________________________________________
Name: svn:mime-type
+ application/octet-stream
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/fi.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/fi.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/fi.ngp (working copy)
@@ -1,1002 +1,3060 @@
-# NgramProfile generated at Sat Sep 25 16:07:36 EEST 2004 for Nutch Language Identification
-ngram_count 19856333
-_ 869519
-a 746167
-i 719129
-t 704098
-e 601663
-s 556512
-n 556389
-o 372975
-l 342834
-ä 330016
-k 308296
-n_ 299202
-u 291199
-m 245066
-a_ 223245
-v 163522
-is 155108
-en 153939
-ta 144281
-r 142026
-y 128266
-st 123814
-j 123202
-ä_ 118777
-h 114477
-tä 111601
-si 110667
-p 107996
-in 105971
-en_ 105139
-tt 102994
-an 95841
-se 92887
-it 89393
-te 88578
-ll 74799
-d 74403
-aa 73747
-va 69765
-mi 69468
-et 66926
-i_ 66649
-oi 65629
-on 64784
-ai 64247
-al 61394
-ka 60884
-li 59837
-sa 59669
-ti 59531
-el 58364
-in_ 58265
-e_ 56751
-ta_ 55549
-tä_ 53234
-an_ 53179
-tu 51580
-ja 50918
-la 50249
-t_ 49855
-es 49770
-ss 49366
-ist 47698
-ks 46788
-ii 44407
-ei 44075
-le 43700
-sta 43336
-ko 43260
-ol 42937
-me 41961
-as 41817
-ma 41476
-ne 41210
-ke 39938
-ö 38955
-ää 38710
-än 38411
-at 38224
-ik 38112
-to 37028
-ki 36355
-us 35998
-nt 35874
-ee 35376
-de 35103
-ett 34518
-ar 34396
-ttä 34382
-jo 34380
-ise 34375
-pa 33958
-ut 33921
-ie 33886
-os 33460
-ni 32798
-uu 32739
-il 32486
-sa_ 31387
-tta 31331
-ia 31273
-sen 31131
-ku 29202
-ot 28712
-nn 28347
-sta_ 27864
-er 27805
-uk 27542
-im 27499
-mis 27422
-ty 27396
-lis 27257
-am 26788
-aan 26779
-ssa 26557
-vä 26347
-io 26216
-lu 26154
-ksi 25543
-mm 25499
-itt 25386
-eu 25334
-ais 25195
-vi 25156
-vo 25033
-än_ 25019
-ri 24986
-uo 24878
-un 24240
-aan_ 24230
-isi 23975
-ssa_ 23905
-s_ 23720
-est 23320
-mä 23026
-em 22327
-taa 21547
-na 21342
-lla 21331
-av 21311
-id 21087
-sä 21064
-ht 21021
-aa_ 20898
-että 20826
-lt 20801
-lli 20722
-si_ 20631
-om 20430
-mu 20164
-ten 19829
-ur 19824
-ste 19820
-ra 19819
-ttä_ 19749
-den 19664
-äs 19240
-stä 19131
-iss 19128
-ell 19030
-een 18638
-he 18568
-ro 18452
-ista 18251
-ast 18148
-äm 18132
-su 18075
-lle 17984
-sk 17983
-op 17965
-ia_ 17761
-kä 17756
-uks 17657
-sen_ 17652
-itä 17587
-den_ 17360
-lä 17305
-yt 17243
-me_ 17180
-kse 17163
-jä 17106
-mme 17101
-ill 16972
-voi 16728
-le_ 16682
-ät 16661
-mme_ 16316
-ns 16290
-pu 16271
-ak 16224
-no 16221
-kk 16193
-at_ 16022
-sia 15940
-la_ 15799
-on_ 15638
-all 15602
-ok 15582
-llis 15546
-tel 15469
-lla_ 15447
-ti_ 15218
-ois 15157
-ys 15053
-sti 14987
-rk 14936
-ha 14921
-nk 14799
-yh 14797
-ust 14795
-ses 14778
-ul 14768
-val 14768
-iin 14638
-ten_ 14532
-äl 14382
-ään 14348
-äi 14322
-hd 14307
-sit 14245
-et_ 14182
-nen 14131
-yö 14113
-oit 14082
-een_ 14067
-so 14018
-nä 14012
-ole 13983
-au 13825
-oo 13786
-ava 13736
-je 13735
-ek 13731
-mie 13701
-nen_ 13681
-toi 13651
-tte 13599
-utt 13595
-pi 13582
-lo 13540
-eh 13341
-ine 13313
-stä_ 13297
-tei 13275
-ka_ 13210
-sii 13167
-tav 13165
-kan 13159
-täm 13097
-ksi_ 12931
-itä_ 12892
-aik 12891
-lm 12860
-ide 12841
-är 12783
-iv 12584
-tö 12479
-lle_ 12324
-ite 12212
-kin 12161
-ui 12154
-ent 12138
-sti_ 12093
-vat 12064
-oll 12062
-o_ 12054
-lai 12050
-eis 11981
-my 11969
-ud 11944
-rv 11932
-omi 11784
-eur 11749
-tää 11692
-iden 11682
-ain 11679
-utta 11548
-sä_ 11514
-ssä 11466
-iin_ 11446
-tam 11435
-inen 11327
-lä_ 11242
-stu 11222
-vat_ 11205
-kai 11196
-iit 11194
-tet 11103
-ämä 11095
-ien 11081
-oh 10981
-sy 10836
-pä 10828
-ises 10821
-ää_ 10794
-pe 10778
-taa_ 10767
-maa 10734
-oli 10717
-ih 10714
-llä 10687
-min 10678
-ah 10618
-isen 10608
-uh 10538
-ssä_ 10390
-yk 10387
-ään_ 10387
-sest 10321
-suu 10307
-ess 10289
-do 10215
-men 10189
-alt 10177
-ös 10174
-uro 10157
-äy 10120
-euro 10113
-g 9975
-ion 9915
-ien_ 9890
-aj 9856
-ukse 9849
-oim 9812
-kin_ 9797
-emm 9786
-roo 9786
-llä_ 9745
-tk 9733
-ita 9692
-tava 9549
-po 9513
-tta_ 9512
-sio 9489
-tee 9445
-oop 9353
-uroo 9349
-roop 9346
-ev 9336
-nta 9336
-yv 9315
-ikk 9224
-ans 9216
-ott 9213
-ude 9208
-tämä 9204
-hte 9161
-ssi 9141
-vu 9137
-arv 9081
-sia_ 9038
-pan 8995
-yht 8981
-dä 8966
-miss 8926
-hi 8898
-äv 8884
-tuk 8825
-sel 8791
-alu 8765
-sten 8688
-kom 8684
-eri 8658
-ike 8619
-imi 8605
-ua 8593
-taan 8588
-äk 8571
-tti 8560
-yy 8559
-iel 8555
-lais 8513
-ou 8490
-sin 8480
-iste 8473
-uv 8471
-hy 8413
-uut 8383
-lta 8338
-mise 8321
-yks 8321
-alli 8275
-asta 8268
-ir 8238
-ost 8198
-ym 8147
-ön 8086
-istä 8082
-ami 8071
-omis 8043
-tar 8014
-myö 7965
-oj 7956
-na_ 7920
-u_ 7920
-tai 7912
-täv 7907
-kaa 7906
-ap 7898
-set 7850
-opa 7849
-tus 7841
-ov 7837
-teis 7812
-or 7808
-uksi 7806
-vas 7747
-aisi 7725
-issa 7712
-re 7705
-di 7687
-asi 7685
-ky 7684
-sis 7671
-komi 7664
-rj 7635
-yhte 7625
-issi 7588
-see 7577
-nne 7528
-ala 7524
-par 7490
-äse 7466
-mist 7457
-tin 7453
-ed 7425
-kos 7409
-aise 7406
-ille 7285
-ksen 7277
-oopa 7274
-usta 7271
-aat 7266
-lise 7249
-jäs 7242
-vast 7214
-hu 7211
-ssio 7207
-nsa 7199
-eid 7197
-int 7180
-jäse 7173
-äsen 7170
-tii 7157
-ass 7122
-un_ 7122
-vai 7115
-puh 7108
-tuks 7099
-nu 7094
-ittä 7088
-nna 7086
-hal 7084
-ve 7080
-itte 7041
-isu 7001
-per 6960
-assa 6926
-att 6924
-lit 6913
-tett 6898
-hdo 6893
-ali 6872
-saa 6868
-nti 6855
-muk 6823
-pan_ 6823
-ity 6822
-toim 6816
-elm 6815
-esi 6812
-ika 6810
-oik 6776
-kans 6741
-esti 6733
-jot 6699
-lin 6684
-ann 6683
-yös 6678
-äyt 6660
-opan 6651
-jen 6637
-joi 6633
-tie 6626
-rit 6551
-ttav 6541
-ja_ 6540
-tää_ 6532
-hyv 6530
-valt 6528
-da 6515
-seen 6510
-nii 6492
-kun 6440
-lma 6438
-isuu 6437
-ioi 6408
-nki 6391
-oni 6379
-osk 6377
-lk 6375
-ark 6352
-ama 6334
-ts 6330
-yvä 6320
-ella 6297
-oike 6285
-eet 6266
-emme 6260
-sal 6257
-del 6245
-ävä 6229
-oid 6226
-pää 6208
-set_ 6185
-lii 6182
-ske 6176
-kosk 6171
-man 6170
-tami 6168
-istu 6166
-ät_ 6152
-va_ 6146
-htei 6142
-oimi 6137
-siin 6134
-vaa 6117
-list 6090
-us_ 6083
-otta 6077
-uud 6056
-ant 6053
-ita_ 6036
-sin_ 6009
-äis 6009
-esta 6006
-äh 6003
-od 5982
-rvo 5977
-dell 5974
-arvo 5973
-keu 5971
-rki 5942
-um 5932
-eli 5928
-äll 5924
-tävä 5895
-myös 5889
-iet 5872
-sto 5872
-stel 5861
-ene 5840
-nte 5838
-ansa 5833
-vois 5819
-tio 5781
-ös_ 5773
-väl 5753
-kui 5738
-ttu 5738
-jen_ 5711
-mei 5711
-ment 5708
-lisi 5704
-aja 5698
-aist 5684
-män 5673
-ame 5657
-isi_ 5652
-rt 5642
-oa 5641
-uhe 5631
-b 5616
-rl 5610
-iä 5607
-isa 5604
-oitt 5603
-amis 5597
-vuo 5591
-ut_ 5587
-lam 5586
-ttaa 5585
-ikeu 5574
-nv 5574
-yös_ 5570
-oma 5565
-ytt 5558
-puhe 5553
-tka 5541
-dän 5525
-mit 5504
-eva 5492
-rla 5492
-maan 5488
-ny 5487
-enk 5470
-uste 5466
-alo 5460
-imm 5451
-mää 5445
-miel 5441
-uol 5435
-ue 5391
-amen 5389
-itta 5379
-ru 5366
-mo 5360
-ele 5355
-arl 5345
-sek 5341
-alla 5326
-sil 5323
-parl 5317
-lame 5316
-arla 5315
-rlam 5315
-asia 5305
-pp 5304
-sitt 5297
-iä_ 5296
-ni_ 5296
-itu 5294
-staa 5290
-ova 5288
-elu 5287
-aikk 5286
-estä 5286
-essa 5281
-mä_ 5259
-vät 5258
-apa 5247
-kka 5244
-ion_ 5211
-unn 5201
-etta 5200
-yn 5189
-käy 5187
-san 5176
-uude 5171
-oht 5169
-kki 5166
-oin 5156
-inn 5147
-laa 5122
-net 5116
-ea 5112
-nkin 5086
-ttel 5083
-iitt 5077
-kaik 5074
-eet_ 5068
-ehd 5067
-pol 5052
-van 5049
-ano 5036
-kä_ 5027
-vät_ 5016
-tän 5013
-idä 5008
-mp 4997
-työ 4985
-y_ 4967
-lem 4964
-lti 4938
-lua 4937
-elli 4922
-tan 4921
-emi 4907
-hä 4902
-män_ 4896
-ute 4896
-isä 4889
-tun 4881
-oisa 4862
-ön_ 4841
-enn 4839
-oka 4839
-ho 4830
-alta 4827
-äst 4827
-enti 4824
-nee 4822
-ime 4817
-iitä 4812
-eks 4805
-rvoi 4794
-ava_ 4790
-yi 4778
-var 4776
-ly 4757
-tis 4751
-lta_ 4728
-äli 4713
-alti 4698
-nio 4694
-ttam 4681
-uka 4681
-sty 4675
-kais 4671
-amm 4668
-uus 4660
-äks 4659
-nni 4644
-kes 4639
-ovat 4619
-ämä_ 4617
-ltio 4608
-poli 4597
-lv 4577
-nin 4577
-muu 4576
-vie 4569
-its 4563
-dot 4561
-tal 4550
-huo 4549
-uni 4541
-hta 4537
-teen 4532
-hyvä 4530
-eit 4522
-dän_ 4516
-yksi 4513
-mai 4508
-tark 4502
-tty 4481
-lue 4476
-osi 4454
-väli 4451
-alai 4444
-sill 4436
-ota 4434
-olli 4430
-illä 4428
-jok 4428
-hm 4424
-sess 4420
-iaa 4415
-kuu 4410
-kys 4397
-utu 4393
-iva 4376
-iik 4371
-halu 4370
-teh 4340
-eru 4335
-äin 4333
-uden 4320
-sell 4309
-sku 4307
-oje 4287
-elt 4274
-peru 4273
-osa 4268
-rus 4267
-uom 4256
-tul 4240
-ote 4238
-taj 4235
-tais 4230
-ij 4215
-sim 4214
-isa_ 4189
-len 4180
-ioni 4179
-ens 4177
-sion 4174
-tse 4171
-jos 4167
-kaan 4165
-iten 4162
-idän 4153
-erus 4147
-pit 4146
-essä 4145
-unio 4143
-nion 4142
-yt_ 4140
-rä 4139
-mat 4137
-tuu 4137
-joka 4102
-pal 4096
-eksi 4081
-imu 4077
-nä_ 4068
-elle 4057
-des 4052
-eil 4052
-tään 4047
-eidä 4045
-esk 4035
-yttä 4027
-nin_ 4017
-enki 4007
-sitä 4002
-mer 4001
-ino 3999
-ttäv 3993
-uutt 3977
-sää 3976
-oske 3974
-oide 3972
-tys 3965
-liit 3963
-yd 3956
-lan 3955
-esit 3938
-ies 3926
-kesk 3926
-äät 3926
-illa 3924
-alua 3923
-tin_ 3919
-hem 3915
-lee 3907
-man_ 3906
-nyt 3902
-aut 3896
-nis 3890
-täi 3888
-isia 3867
-es_ 3863
-hin 3863
-käyt 3844
-täy 3840
-mas 3830
-näi 3829
-kev 3827
-asti 3824
-itse 3824
-ju 3821
-ksia 3820
-amme 3819
-ata 3819
-uur 3818
-lev 3816
-neu 3816
-oita 3816
-tek 3791
-ykse 3789
-yl 3782
-isin 3780
-les 3775
-äär 3772
-aal 3767
-koh 3760
-pai 3740
-ana 3736
-otk 3728
-uvo 3722
-päät 3721
-euv 3715
-euvo 3713
-neuv 3713
-ohta 3712
-ati 3711
-ris 3706
-jotk 3701
-ina 3700
-aika 3696
-ken 3691
-f 3689
-ian 3684
-yis 3681
-ua_ 3676
-oka_ 3672
-vii 3641
-kau 3630
-ihe 3628
-lou 3628
-soi 3624
-tois 3611
-joh 3606
-ämi 3600
-oist 3584
-vä_ 3568
-iset 3564
-ahd 3561
-stö 3561
-tust 3559
-env 3555
-yst 3552
-siit 3545
-uit 3542
-oa_ 3530
-muka 3527
-kis 3525
-rke 3525
-dis 3518
-hen 3513
-oja 3511
-telu 3510
-nka 3507
-lmi 3505
-eist 3504
-uot 3500
-tuo 3498
-puo 3494
-py 3489
-tenk 3489
-ehdo 3487
-hän 3484
-puol 3483
-sem 3483
-yr 3475
-kut 3470
-ilm 3457
-eill 3456
-aks 3452
-ltä 3452
-van_ 3451
-olla 3447
-tka_ 3442
-talo 3441
-ila 3438
-til 3433
-ttää 3432
-otka 3429
-kei 3423
-ysy 3408
-dist 3393
-erk 3391
-mies 3377
-täs 3376
-alue 3372
-erit 3372
-ojen 3366
-aki 3363
-kol 3363
-jär 3360
-ail 3357
-hdot 3351
-elma 3348
-ode 3344
-ämän 3343
-vos 3342
-lisu 3340
-loi 3335
-mine 3335
-oks 3334
-tama 3333
-ran 3332
-iti 3327
-eta 3325
-mmä 3325
-uun 3325
-väk 3325
-alou 3324
-ton 3324
-itet 3319
-opi 3316
-ttäm 3313
-nut 3307
-isii 3305
-jat 3302
-uin 3299
-muks 3292
-oss 3288
-emie 3274
-aus 3271
-neet 3259
-ng 3256
-kii 3253
-tiet 3250
-iks 3244
-unt 3244
-ossa 3243
-li_ 3236
-sano 3232
-osta 3231
-ska 3231
-ies_ 3225
-onn 3223
-nva 3222
-anta 3217
-muut 3199
-ee_ 3198
-tap 3190
-ätt 3186
-lj 3185
-hemi 3184
-uhem 3184
-vost 3179
-elä 3169
-rje 3167
-eut 3166
-kas 3164
-iksi 3161
-sv 3160
-sym 3160
-eide 3146
-olem 3144
-onk 3141
-isee 3139
-väks 3138
-uva 3135
-eti 3134
-käs 3134
-äin_ 3129
+# NgramProfile generated at Tue May 31 01:52:21 CEST 2005 for Nutch Language Identification
+a 14292744
+i 13408044
+t 13297039
+e 11600593
+n 10592267
+s 10373945
+o 6968772
+l 6453020
+ä 6063455
+k 5850317
+u 5615507
+m 4614125
+v 3095318
+r 2824966
+y 2389580
+p 2354693
+j 2272478
+h 2193247
+d 1506813
+ö 732584
+g 312662
+b 122484
+c 88101
+f 76096
+z 26093
+w 24056
+x 6569
+é 5875
+q 4741
+á 2752
+à2303
+ü 2001
+ó 1826
+è 930
+æ 927
+ò 409
+ú 353
+à346
+ç 340
+ñ 327
+ê 297
+ã 254
+ø 210
+ß 205
+Ã¥ 173
+ï 108
+â 88
+º 68
+û 63
+ô 48
+ë 37
+ì 22
+î 8
+ù 8
+õ 4
+ý 4
+µ 3
+ð 3
+þ 3
+n_ 5585923
+a_ 4178488
+en 2834762
+is 2833230
+ta 2728469
+st 2339353
+ä_ 2176447
+tä 2026678
+in 1995507
+si 1982461
+tt 1945000
+an 1887027
+_t 1848612
+_k 1753784
+se 1690532
+te 1677040
+it 1637620
+_e 1472013
+_s 1425159
+aa 1394870
+_j 1388620
+ll 1378156
+_o 1327651
+va 1322564
+_p 1290573
+mi 1287601
+et 1275012
+i_ 1248093
+_m 1209295
+on 1204334
+oi 1189042
+ai 1180617
+e_ 1174566
+al 1129005
+ka 1127229
+ti 1125895
+li 1124285
+sa 1113869
+_v 1110197
+el 1091773
+tu 995840
+es 989158
+la 978054
+t_ 966787
+ja 936515
+ss 894285
+ks 889534
+me 836093
+le 829787
+ii 821698
+ke 820314
+ei 803652
+ma 803555
+ko 798842
+ol 797798
+_a 788838
+ne 779350
+as 768872
+at 736869
+ää 726140
+to 725703
+än 722620
+nt 684195
+ki 683614
+us 682757
+ik 678009
+ut 660459
+ar 659866
+de 658006
+ee 655515
+ie 647608
+pa 636338
+jo 633985
+il 625958
+_h 623434
+er 620991
+_n 619157
+uu 608816
+os 605456
+ni 596400
+am 582150
+ia 579639
+ku 566789
+nn 557245
+ot 547079
+_l 542826
+uk 525156
+ty 521451
+im 509546
+vä 493511
+na 480519
+vi 480045
+ri 477663
+lu 477349
+s_ 474192
+uo 473425
+io 467846
+eu 466306
+id 465652
+vo 462088
+un 454868
+mm 452753
+em 433617
+mä 419263
+av 405406
+ht 397456
+ra 390387
+he 388733
+sä 388558
+mu 387083
+ak 379921
+om 376334
+ur 375782
+_y 374551
+lt 370230
+ro 357749
+su 351472
+äs 335354
+op 334976
+kä 332796
+yt 332631
+sk 331935
+pu 324654
+äm 320762
+lä 317346
+ns 310726
+ok 306569
+jä 305464
+ät 305033
+kk 302156
+no 300389
+_i 299802
+ul 294003
+ys 283188
+_r 281074
+rk 280422
+hd 277763
+pe 274972
+äi 272693
+ha 272313
+yh 271599
+nk 271186
+au 263996
+yö 262572
+pi 261535
+eh 260378
+je 259241
+lo 257794
+ek 256574
+äl 256195
+nä 255938
+oo 253963
+iv 246612
+so 244137
+lm 243718
+p_ 242048
+o_ 241335
+är 236784
+ui 233350
+rv 229209
+tö 228915
+uh 223023
+_u 220839
+ud 218743
+ua 213529
+my 207981
+oh 205509
+pä 202465
+sy 197096
+do 196383
+yk 196169
+ah 195856
+aj 193189
+ih 189825
+tk 188352
+ös 185457
+äy 181900
+ev 180334
+ou 179257
+ea 176784
+vu 174823
+uv 170333
+yv 169038
+äk 167712
+hi 167664
+po 164691
+äv 161896
+or 161632
+dä 158509
+hy 155302
+u_ 154298
+ön 153483
+yy 151220
+di 151026
+ap 150970
+ir 149123
+re 148790
+ov 147456
+ym 147272
+nu 142974
+oj 142364
+ve 142138
+ky 140287
+rj 138304
+hu 137553
+ed 137328
+sp 128444
+da 127942
+lk 125402
+ng 122366
+r_ 117726
+um 114304
+od 114019
+ts 112021
+iä 108153
+ny 108027
+ge 107456
+äh 107429
+rt 107127
+oa 106460
+pp 105955
+rl 105637
+yn 103110
+mo 101241
+nv 100484
+ru 96676
+d_ 96552
+ly 94714
+ho 94550
+hä 94109
+ij 91780
+yi 91645
+ue 89902
+mp 89776
+y_ 89545
+lv 82252
+_d 81791
+hm 73308
+yd 72936
+yl 70871
+rä 70832
+ju 70099
+_b 69786
+lj 65245
+nö 64574
+ag 63024
+rr 62610
+yr 62229
+sv 62216
+py 62198
+gu 60381
+uj 55622
+eä 54419
+ry 52663
+kr 52090
+ip 50696
+gi 49838
+du 49223
+ök 48386
+hj 47084
+up 46475
+kt 46263
+ad 45321
+yä 44841
+ga 44709
+ey 44548
+nj 44258
+ji 44143
+öt 43930
+ö_ 43538
+pr 42651
+_ä 42618
+rm 42384
+sl 41849
+öi 41459
+dy 40667
+np 39433
+eg 39004
+sm 38948
+ep 38317
+kö 38207
+nm 36541
+nl 32230
+_f 32203
+sö 31975
+_c 31826
+öl 31080
+ae 30438
+tr 29668
+rs 29584
+lö 29506
+öm 29495
+öö 29478
+lp 27509
+öj 26764
+hk 26726
+_g 26360
+rh 26298
+äd 25396
+ch 24679
+nh 24610
+eo 24574
+l_ 24544
+rg 24010
+rd 23307
+nd 22990
+ej 22845
+öy 21394
+be 21127
+ba 20914
+öä 20853
+hv 20213
+fr 19629
+kl 19386
+oe 18505
+äj 18017
+go 17967
+bu 16566
+bo 16273
+äe 16032
+yj 15955
+rp 15928
+fi 15258
+_w 14518
+br 14423
+nf 14266
+kn 14006
+k_ 13663
+jö 12985
+co 12970
+og 12916
+iu 12674
+öp 12644
+hn 12409
+sc 12310
+ca 12010
+fe 12004
+hr 11953
+äp 11681
+bi 11675
+sj 11561
+ao 11449
+vy 11340
+äa 10825
+iö 10807
+pt 10513
+öd 10495
+sh 10292
+ps 10251
+ye 10121
+sn 10062
+äo 10035
+sr 10024
+af 9759
+th 9728
+öh 9690
+ab 9606
+m_ 9591
+nr 8799
+rn 8509
+ac 8090
+dj 7894
+ic 7882
+yp 7878
+ug 7770
+g_ 7682
+gr 7624
+ib 7608
+ec 7564
+pö 7060
+ig 6830
+mb 6789
+öv 6732
+ör 6677
+c_ 6545
+fl 6468
+dr 6196
+of 6152
+gl 6130
+ck 5919
+fo 5913
+v_ 5897
+z_ 5892
+fa 5809
+h_ 5776
+ob 5754
+ls 5617
+lg 5614
+ci 5474
+tl 5281
+öa 5236
+if 5220
+ez 5213
+ld 5198
+wa 5153
+ms 5138
+hl 5001
+jy 4884
+ce 4810
+b_ 4802
+rb 4785
+za 4525
+iy 4310
+nc 4254
+oy 4242
+zi 4126
+rö 4081
+bl 4045
+zz 4041
+cu 4005
+wi 4000
+hö 3930
+rc 3916
+ay 3898
+pl 3840
+qu 3786
+ya 3782
+sb 3580
+ub 3507
+iz 3483
+wt 3462
+eb 3337
+we 3295
+by 3239
+oc 3230
+lb 3012
+lh 2935
+f_ 2912
+dt 2892
+bs 2845
+_ö 2842
+öo 2762
+ow 2596
+cr 2588
+_z 2531
+dö 2485
+wo 2411
+ux 2351
+az 2341
+tn 2333
+x_ 2281
+nz 2254
+uc 2245
+xe 2189
+pk 2162
+ze 2108
+öe 2101
+mc 2073
+dd 2053
+gn 2036
+gh 2029
+ff 1955
+fg 1955
+tz 1898
+zo 1884
+cc 1869
+ph 1817
+ew 1765
+fu 1666
+j_ 1625
+cl 1516
+kp 1506
+én 1496
+kh 1470
+uz 1445
+yo 1423
+ds 1389
+cn 1388
+ál 1377
+ón 1371
+nb 1334
+w_ 1318
+gm 1308
+_x 1305
+ef 1297
+uy 1261
+_q 1245
+sd 1239
+mé 1200
+tp 1197
+jn 1174
+bj 1170
+lz 1124
+gg 1116
+lf 1105
+ró 1103
+é_ 1093
+sw 1069
+ÃÂn 1025
+án 1022
+bk 1007
+rf 989
+xi 936
+tj 934
+ws 931
+ox 910
+zá 906
+bö 858
+gö 830
+kv 823
+rü 819
+vk 818
+gy 815
+rz 814
+wh 805
+wu 791
+fy 778
+ér 778
+bb 768
+bw 757
+ln 749
+yu 744
+cd 743
+ré 738
+uf 721
+db 720
+ct 714
+ÃÂa 713
+üb 707
+tv 696
+aw 684
+ex 682
+zu 682
+gd 675
+dz 670
+mö 654
+js 648
+jk 626
+gk 625
+gt 621
+lé 619
+rà609
+jt 600
+és 587
+ml 574
+qv 574
+dn 565
+xa 562
+wy 543
+tà539
+lc 528
+cq 525
+_á 519
+mf 516
+uq 504
+wl 491
+zq 490
+dh 483
+tm 473
+pé 469
+ix 467
+cà458
+èr 448
+mü 445
+vc 437
+tc 436
+ft 433
+sf 433
+üh 432
+bh 430
+sq 428
+iè 424
+cm 423
+oä 417
+éd 414
+km 412
+æk 398
+bæ 394
+dq 391
+ié 391
+yg 389
+sá 387
+nw 378
+iw 372
+iq 366
+wm 366
+ná 365
+zn 361
+bé 360
+hé 359
+ué 359
+rq 347
+df 345
+vé 343
+dü 341
+ül 338
+vö 335
+hw 330
+dm 325
+sé 325
+rè 313
+yb 311
+uw 308
+ès 303
+fä 300
+dà296
+vs 295
+dw 292
+pv 288
+mj 287
+má 287
+iæ 283
+kx 283
+tw 283
+kj 281
+bn 278
+él 278
+ó_ 276
+öc 274
+êt 269
+mn 267
+tê 265
+ún 259
+òl 258
+cy 252
+fs 251
+sò 251
+ão 250
+cú 249
+ça 248
+ün 245
+bd 240
+dl 238
+cs 236
+ög 234
+ég 230
+pc 224
+dg 220
+rw 220
+té 217
+kf 215
+mt 212
+ÃÂe 204
+hc 202
+xx 202
+sà201
+vr 201
+tf 200
+äu 200
+dé 199
+só 198
+æi 197
+ær 197
+oz 196
+jæ 195
+lq 195
+zb 192
+öw 191
+gs 190
+à_ 190
+ÃÂ_ 189
+dk 184
+pj 183
+cf 180
+ét 176
+öu 174
+ør 173
+dc 172
+hh 168
+zf 167
+zs 167
+aö 164
+ax 157
+qa 157
+éo 157
+fn 155
+eq 153
+aß 150
+añ 145
+cp 145
+gb 144
+zh 144
+cò 143
+wn 142
+q_ 138
+mh 136
+év 136
+jø 134
+ño 132
+fc 131
+zl 131
+pm 130
+rç 129
+mr 127
+vl 127
+ür 125
+sg 123
+_Ã¥ 121
+gü 120
+tb 120
+ló 119
+td 117
+tx 117
+äö 117
+aä 116
+oö 115
+á_ 115
+óp 112
+aç 111
+ww 110
+bc 107
+gp 106
+tg 106
+Ã¥r 105
+fm 104
+iñ 103
+pf 103
+éc 103
+ár 102
+tà100
+iã 99
+ß_ 98
+ñe 92
+fp 91
+ió 88
+æ_ 87
+éa 87
+äf 86
+üs 85
+_é 81
+wr 81
+xv 81
+cb 80
+tó 79
+mg 78
+_â 77
+hb 76
+â_ 76
+qi 75
+zr 75
+hü 74
+ña 72
+fé 69
+rà69
+ò_ 69
+aï 68
+nç 68
+ée 68
+às 67
+éb 67
+_º 66
+là66
+äb 66
+aq 65
+dv 65
+md 65
+nè 65
+né 65
+mv 64
+rx 64
+lr 63
+òn 63
+oû 62
+ût 62
+èd 61
+_ó 60
+xf 60
+º_ 60
+àn 60
+_à59
+kg 59
+dp 58
+là58
+xp 58
+ßi 58
+tá 56
+uä 56
+vd 56
+éu 56
+mã 54
+pd 54
+uö 54
+ço 53
+rã 52
+vp 52
+ÃÂg 52
+bv 50
+gä 50
+xo 50
+xt 49
+cg 48
+hs 47
+oñ 47
+hp 46
+ïr 46
+bt 45
+mà45
+gj 44
+lá 44
+zó 44
+fd 42
+gé 41
+vn 41
+cw 40
+yá 40
+eß 39
+gv 39
+uà39
+vv 39
+wf 39
+ém 39
+mk 38
+ßl 38
+fb 37
+bm 36
+mè 36
+aà35
+rá 35
+pn 34
+fk 33
+mó 33
+vg 31
+èg 31
+cj 30
+væ 30
+wc 30
+æg 30
+öb 30
+eö 29
+jd 29
+sã 29
+zc 29
+ác 29
+hô 28
+vá 28
+zk 28
+èn 28
+tü 27
+xh 27
+ás 27
+éi 27
+ôn 27
+kw 26
+jm 25
+jü 25
+nü 25
+yw 25
+ái 25
+fv 24
+fó 24
+rú 24
+ÃÂs 24
+øl 24
+mø 23
+wü 23
+éj 23
+ñi 23
+lü 22
+yc 22
+yf 22
+kd 21
+sø 21
+öf 21
+úc 21
+Ã¥s 20
+ÃÂo 20
+üt 20
+có 19
+eï 19
+gw 19
+jú 19
+mw 19
+sü 19
+ÃÂt 19
+üd 19
+lw 18
+vt 18
+wb 18
+xu 18
+äc 18
+ép 18
+ël 18
+úa 18
+gc 17
+hf 17
+sz 17
+sú 17
+ïn 17
+gø 16
+så 16
+xc 16
+zw 16
+òa 16
+bp 15
+há 15
+lè 15
+vè 15
+zm 15
+ÃÂl 15
+ús 15
+cv 14
+pb 14
+èv 14
+ï_ 14
+iú 13
+oq 13
+wk 13
+zü 13
+äg 13
+çi 13
+_ì 12
+_ü 12
+bá 12
+bä 12
+bü 12
+dó 12
+eñ 12
+fh 12
+fü 12
+gó 12
+iá 12
+jp 12
+lx 12
+oë 12
+và12
+wd 12
+àl 12
+ád 12
+áv 12
+èa 12
+ÃÂc 12
+ór 12
+fá 11
+hz 11
+kb 11
+nà11
+pg 11
+sè 11
+uè 11
+xl 11
+xw 11
+zt 11
+zy 11
+Ã¥_ 11
+éz 11
+úi 11
+_è 10
+kü 10
+mà10
+àa 10
+çu 10
+ói 10
+ól 10
+eó 9
+jv 9
+Ã¥n 9
+çã 9
+_à8
+_ï 8
+aë 8
+cá 8
+gf 8
+rê 8
+rò 8
+tç 8
+vm 8
+zg 8
+áb 8
+Ã¥t 8
+ïs 8
+úb 8
+üc 8
+üg 8
+_ç 7
+_ê 7
+eá 7
+fj 7
+fö 7
+gè 7
+hæ 7
+hè 7
+jr 7
+jz 7
+jà7
+kc 7
+nq 7
+rô 7
+uñ 7
+vj 7
+wp 7
+zp 7
+át 7
+èl 7
+éé 7
+ët 7
+ìg 7
+ôt 7
+úl 7
+aú 6
+bg 6
+bq 6
+cé 6
+iç 6
+ké 6
+nx 6
+oã 6
+pó 6
+rå 6
+uß 6
+uê 6
+en_ 1925287
+in_ 1077139
+ta_ 1037376
+an_ 1016457
+tä_ 966025
+ist 892272
+sta 822521
+on_ 805834
+ja_ 712891
+ett 648835
+ttä 637156
+_ja 634836
+ise 626628
+tta 599005
+sa_ 581313
+_on 580309
+sen 547876
+_va 547268
+aan 503632
+lis 503235
+_jo 503083
+ssa 495417
+mis 486530
+itt 483129
+_ko 482824
+ksi 466497
+än_ 463617
+ais 451440
+est 450149
+isi 437037
+_ta 413242
+me_ 408243
+taa 407778
+_tä 399739
+aa_ 397132
+_ka 390085
+_et 389264
+lli 384679
+lla 381954
+si_ 380239
+ste 372324
+_si 368400
+ten 363739
+stä 361629
+_ol 359144
+den 351293
+een 347873
+ell 346323
+uks 343792
+_se 342747
+kse 341628
+lle 338521
+iss 334062
+ia_ 330921
+ast 330111
+_ku 318011
+ill 316935
+_mi 315116
+le_ 311032
+tel 309716
+_to 309398
+at_ 305282
+voi 301412
+itä 300396
+mme 297914
+la_ 291680
+sia 291048
+ti_ 286795
+ust 286607
+all 283546
+val 282986
+ses 280210
+mie 277144
+sti 275484
+iin 272406
+ois 271900
+ään 271206
+_tu 271002
+et_ 266652
+ava 266541
+sit 260953
+_pa 260249
+toi 258985
+tav 258153
+nen 257917
+tte 257078
+utt 256565
+oit 256026
+ole 255557
+ka_ 245753
+kan 243635
+tei 241876
+ine 240620
+_sa 237816
+aik 237326
+_p_ 236659
+täm 233933
+_ma 233142
+sii 232430
+ide 231809
+ite 228966
+vat 228670
+oll 225902
+ent 224734
+kin 224733
+ain 220815
+_pu 219658
+eur 218204
+_mu 216737
+stu 216719
+tää 215826
+eis 212330
+tet 212126
+maa 210721
+omi 210321
+tam 209858
+_eu 209511
+sä_ 209266
+ssä 208389
+lai 207234
+_te 206429
+_me 206176
+oli 205300
+iit 205288
+lä_ 204823
+ää_ 203168
+_yh 201738
+_jä 201213
+min 200407
+kai 200315
+suu 199055
+ien 196676
+ämä 195820
+_ei 194900
+ess 194490
+men 193509
+llä 192454
+uro 186519
+ame 186082
+_la 185077
+_ke 181847
+oim 179349
+ita 179131
+tuk 178941
+nta 178873
+ans 176749
+roo 176247
+alt 175867
+ott 175596
+_ha 174919
+emm 172399
+arv 169291
+oop 168521
+tee 168283
+tti 167557
+ikk 167554
+hte 166601
+pan 166514
+_as 164313
+ude 163686
+ion 163160
+eri 161308
+yht 159957
+sio 159753
+ost 159348
+ei_ 157487
+yks 156937
+uut 156864
+_vo 155670
+kom 155216
+iel 155158
+imi 154544
+puh 153853
+alu 153765
+tar 153680
+ami 150916
+_kä 150780
+ssi 150267
+sel 150220
+tus 149924
+sin 149279
+set 149045
+_su 148819
+tin 148768
+tai 148345
+_en 147691
+ike 147438
+ala 146943
+_ai 145865
+kaa 145762
+lta 145544
+_ti 145506
+na_ 144065
+see 143679
+nne 143661
+täv 143158
+vas 142384
+_my 142320
+aat 141759
+_al 141110
+se_ 140399
+int 140365
+_hy 140341
+_ra 140072
+asi 139578
+opa 139541
+vai 139358
+saa 138998
+par 138538
+myö 137512
+isu 136710
+nna 136622
+_li 136425
+_vi 135808
+tii 135234
+nsa 135019
+hdo 134317
+un_ 134154
+sis 133779
+kos 132188
+_ar 132125
+att 131685
+rit 131660
+lan 131290
+esi 131133
+_es 130973
+uhe 130011
+ann 129944
+_ni 129898
+ass 129508
+muk 129426
+hal 128587
+ity 127855
+ali 127247
+nti 127211
+eid 126668
+va_ 126279
+kun 125777
+ker 125476
+tie 123631
+ark 123586
+lii 123512
+_pe 122411
+lin 122266
+ika 122180
+elm 121851
+joi 121841
+lma 121739
+ama 121683
+jen 121607
+ävä 121527
+jot 121506
+_vä 120937
+ant 120504
+iet 119866
+nki 119845
+äse 119652
+man 119607
+äyt 119571
+lit 119514
+yös 119489
+hyv 119447
+_pi 119364
+_pä 118417
+osk 118210
+del 117917
+per 117395
+ake 117170
+ske 116957
+pää 116877
+us_ 116497
+sto 115916
+_ne 115507
+jäs 115491
+äis 115051
+eet 114452
+ut_ 114258
+emi 114160
+yvä 114051
+ät_ 114021
+_er 113730
+_nä 113617
+eli 113562
+ioi 113049
+vaa 112119
+nii 111221
+oid 111219
+_he 110128
+ytt 109695
+nte 109692
+ene 109599
+uud 109529
+kui 109100
+_so 108873
+aja 108379
+sal 107783
+rki 107482
+vuo 107461
+oik 107251
+rvo 106177
+_na 106090
+enk 105262
+oni 104695
+oma 104476
+uol 104353
+eva 104339
+alo 104307
+_hu 103981
+elu 103853
+väl 103830
+inn 103317
+män 103100
+ttu 103090
+ehd 103026
+lam 102891
+äll 102866
+tan 102735
+_ki 102613
+unn 102607
+sek 102380
+mei 102262
+työ 102139
+_po 101989
+rla 101882
+isa 101870
+oin 101866
+tka 101859
+iä_ 101844
+oht 101010
+tio 100851
+ös_ 100819
+ova 100727
+kka 100560
+mää 100464
+es_ 100123
+ni_ 100103
+ele 99914
+er_ 99591
+käy 98072
+kki 97873
+arl 97449
+van 97423
+sil 97160
+mit 97150
+dän 97120
+_os 97057
+tän 97047
+apa 96630
+laa 96449
+vät 96409
+imm 95872
+net 94675
+oka 94186
+tun 94177
+itu 93986
+san 93976
+mä_ 93425
+ies 93332
+sty 93116
+enn 93099
+_ky 92728
+_vu 92627
+ön_ 92613
+keu 92215
+kä_ 92199
+kes 92198
+hem 92154
+nni 91873
+nee 91557
+ime 91449
+tal 91133
+lua 90987
+pea 90852
+ute 90790
+mai 90523
+lem 90517
+dot 89948
+pol 89942
+_id 89511
+iva 89397
+_ty 89139
+hta 88380
+äks 88363
+tul 88281
+spe 88117
+lti 88099
+eks 88026
+uus 87748
+idä 87644
+ano 87593
+iik 87518
+isä 86920
+äst 86718
+nam 86675
+huo 86307
+id_ 86067
+vie 86053
+imu 85846
+kuu 85542
+nin 85492
+äli 85394
+muu 85307
+yt_ 85302
+tis 85269
+utu 84642
+eak 84061
+var 83946
+tty 83842
+eit 83504
+pal 83405
+amm 83333
+äin 83322
+len 83257
+teh 82931
+ota 82822
+_sp 82632
+neu 82445
+_ed 82231
+jok 81963
+sku 81794
+mat 81699
+_ov 81684
+uka 81268
+elt 81109
+uvo 80694
+euv 80559
+taj 80537
+ote 80523
+_lu 80042
+ens 79753
+nyt 79635
+pit 79539
+uom 79428
+esk 78890
+ino 78788
+kys 78778
+_eh 78131
+its 77694
+sää 77202
+osi 77077
+nis 76860
+des 76218
+lee 75923
+uni 75903
+ne_ 75557
+nio 75465
+lev 75430
+aut 75245
+hin 74610
+ina 74585
+ati 74076
+oje 74036
+sim 73954
+koh 73644
+lou 73568
+äät 73558
+ken 73362
+iaa 73030
+nä_ 72951
+tys 72947
+_un 72835
+tuu 72806
+ata 72786
+jos 72731
+eil 72592
+täi 72553
+mer 72383
+kev 71838
+tek 71757
+_oi 71679
+osa 71638
+eru 71386
+vii 71311
+uur 71285
+ian 71051
+ua_ 71042
+kis 70769
+rus 70338
+yis 70052
+vä_ 69859
+mas 69665
+uot 69638
+til 69429
+kut 69297
+näi 69262
+dis 69209
+puo 69152
+les 69119
+kau 69117
+joh 68886
+ila 68821
+tse 68651
+äär 68083
+hän 68080
+vos 67821
+hen 67668
+ilm 67632
+ode 67542
+_an 67329
+eti 67091
+ahd 66991
+ana 66863
+ton 66596
+nut 66530
+otk 66420
+yst 66311
+jär 66295
+aks 66096
+lue 66067
+ran 65737
+pai 65726
+ämi 65547
+ris 65516
+onn 65442
+eta 65358
+nka 65325
+rke 65308
+ihe 65262
+uin 65252
+uit 65126
+opi 65078
+aki 64984
+oa_ 64979
+lmi 64621
+tuo 64491
+uun 64444
+unt 64387
+aal 64354
+oja 64329
+väk 63904
+kol 63812
+nnö 63792
+mmä 63773
+otu 63661
+_uu 63526
+täy 63012
+ltä 62936
+nan 62832
+lut 62826
+sem 62574
+kei 62549
+ang 62361
+erk 62315
+kii 62001
+kas 61856
+ee_ 61741
+jat 61648
+uva 61627
+atk 61191
+ail 61183
+äne 61139
+rje 61138
+oks 60766
+sop 60508
+li_ 60449
+ska 60448
+iti 60405
+käs 60364
+rat 60257
+ivä 60231
+rvi 60229
+tap 60033
+env 60015
+stö 59770
+elä 59632
+täs 59583
+ppa 59355
+iks 59267
+ärj 59089
+aus 58990
+kus 58861
+ull 58726
+jes 58650
+tyi 58635
+ysy 58467
+ätt 58220
+hee 58193
+ulu 58178
+_py 58175
+kok 57884
+oss 57793
+sym 57294
+jon 57176
+ema 57109
+eut 57070
+loi 57006
+ntö 57006
+ihi 57002
+ter 56953
+vis 56804
+mut 56789
+_ve 56712
+tyk 56475
+_ny 56315
+vin 56192
+äsi 56001
+age 55820
+nsi 55747
+pim 55731
+tto 55704
+_el 55545
+ees 55439
+soi 55356
+ntä 55291
+ärk 55273
+_sy 54935
+io_ 54847
+_il 54507
+onk 54407
+ara 54371
+nva 54371
+yhd 54023
+ink 53867
+ima 53778
+ytä 53698
+oon 53648
+uri 53573
+aka 53467
+opp 53466
+ätö 53405
+eel 53318
+ein 53280
+ase 53266
+nno 53252
+mah 53221
+_ri 53162
+ri_ 53103
+rin 53032
+ge_ 53021
+gua 52997
+_yk 52789
+keh 52643
+dol 52606
+syy 52528
+ko_ 52527
+ngu 52501
+oko 52458
+luo 52440
+aih 52420
+koi 52419
+tu_ 52280
+äss 52187
+uag 52105
+ani 51668
+mmi 51580
+etu 51452
+iis 51380
+_ot 51189
+_lä 51043
+ikä 50841
+nto 50611
+ule 50559
+noi 50478
+kea 50278
+aav 50169
+_mo 50110
+sam 50095
+eni 50060
+uis 49978
+_hä 49964
+nit 49913
+kon 49637
+ete 49548
+yvi 49448
+te_ 49415
+äri 49409
+ivi 49380
+suo 49286
+auk 49202
+ai_ 49086
+siä 49034
+uta 49002
+os_ 48884
+ous 48837
+tum 48818
+jel 48565
+hit 48363
+yde 48332
+eht 48320
+raa 48314
+tär 48294
+vit 48078
+ehi 47963
+_yl 47900
+nes 47769
+kee 47752
+oi_ 47720
+tod 47616
+änt 47432
+kil 47297
+tut 47268
+tur 47238
+kit 47207
+rkk 47161
+_lo 47108
+kul 46838
+ki_ 46762
+tom 46651
+ede 46604
+ank 46380
+umi 46180
+det 46174
+tas 45915
+rah 45720
+ymy 45682
+use 45674
+ida 45654
+nss 45563
+avo 45500
+oud 45428
+oil 45234
+ntt 45177
+han 45126
+ämm 45089
+_it 45007
+_ju 44935
+iko 44914
+ulk 44901
+kem 44765
+keä 44764
+kke 44715
+elv 44710
+täl 44690
+sik 44585
+uod 44482
+etä 44243
+ksy 44236
+jan 44227
+kal 44224
+ys_ 44167
+tot 44148
+yön 44007
+evi 43961
+oiv 43957
+tia 43871
+hde 43771
+tyy 43768
+iiv 43700
+ohj 43630
+to_ 43546
+ely 43462
+avi 43427
+aam 43383
+mus 43348
+ias 43295
+eik 43221
+tak 43048
+mal 42967
+hei 42931
+rva 42871
+ätä 42740
+inu 42547
+uon 42539
+hmi 42486
+_sä 42480
+kie 42357
+_no 42236
+ito 42216
+aas 42214
+rii 42141
+ryh 42041
+_us 41915
+_mä 41886
+ros 41858
+kää 41781
+avu 41692
+vel 41509
+err 41473
+uul 41367
+ärä 40907
+ekä 40762
+kor 40747
+yä_ 40704
+toj 40696
+ait 40600
+ria 40550
+_de 40508
+ena 40455
+sie 40315
+mio 40160
+htä 40103
+mia 40000
+usk 39982
+änn 39842
+enä 39841
+sva 39751
+uu_ 39597
+mon 39339
+ini 39214
+pau 39153
+opu 39090
+läh 38972
+tym 38965
+ttö 38832
+sei 38676
+ma_ 38670
+nal 38602
+yty 38587
+uor 38554
+yyt 38435
+mar 38430
+nai 38424
+nge 38324
+inä 38157
+vää 38139
+yri 38061
+ohd 38010
+_ih 37930
+nnu 37831
+oku 37820
+nsä 37737
+ähe 37696
+vän 37600
+tim 37405
+ert 37327
+ied 37319
+tau 37245
+ura 37112
+aaj 37046
+näk 36948
+mät 36944
+lop 36885
+isk 36844
+ihm 36770
+ymi 36649
+iot 36502
+seu 36437
+mil 36381
+mma 36340
+aha 36307
+kko 36291
+hoi 36276
+ari 36236
+nei 36215
+da_ 36148
+mik 36147
+äni 36027
+mui 35999
+tyv 35946
+lau 35860
+ält 35783
+paa 35732
+sai 35656
+ate 35650
+_av 35646
+jä_ 35574
+ver 35489
+uss 35452
+ona 35379
+ori 35213
+pro 35094
+_ää 35077
+kir 35001
+myk 34947
+_ym 34858
+päi 34823
+_n_ 34792
+iku 34781
+vak 34665
+önt 34561
+urv 34552
+yy_ 34367
+kti 34346
+_ry 34338
+iok 34193
+lei 34176
+ont 34079
+tuv 34077
+eto 34003
+ntu 33997
+änä 33925
+tyn 33836
+ong 33829
+ea_ 33625
+nos 33576
+lij 33522
+alv 33417
+rik 33402
+daa 33358
+tui 33312
+lio 32974
+is_ 32818
+oro 32794
+irj 32751
+noa 32700
+usi 32677
+lus 32538
+tki 32517
+yhm 32507
+lke 32439
+las 32411
+tua 32302
+iih 32277
+jo_ 32231
+ivo 32160
+ty_ 32148
+_aj 32127
+uos 32038
+uht 31829
+ilt 31820
+tös 31802
+lyt 31729
+aar 31637
+isö 31602
+luk 31558
+gel 31538
+kat 31488
+jäl 31480
+toa 31363
+mpi 31315
+mak 31291
+hti 31279
+von 31142
+pid 31079
+not 31019
+ijä 30940
+ija 30877
+tos 30876
+eiv 30875
+tät 30859
+nom 30722
+hdi 30709
+uee 30690
+rra 30672
+ot_ 30663
+nat 30661
+eki 30620
+dä_ 30597
+oso 30582
+uai 30570
+ski 30564
+vap 30564
+kou 30499
+tön 30490
+inv 30460
+ira 30443
+njo 30387
+rko 30294
+sko 30266
+aad 30189
+rak 30128
+yöt 29978
+lmä 29966
+öst 29935
+aho 29879
+sov 29868
+isy 29864
+ouk 29803
+väh 29796
+enj 29787
+pa_ 29743
+suh 29671
+nem 29656
+iid 29646
+uma 29593
+yn_ 29522
+hje 29506
+usa 29382
+arm 29310
+eus 29302
+rja 29194
+ire 29191
+vir 29105
+aht 29078
+eud 29066
+nim 29060
+ljo 29017
+vio 28840
+rjo 28837
+art 28806
+rau 28792
+yse 28593
+ähä 28592
+ulo 28583
+ins 28526
+_in 28486
+via 28442
+ekt 28421
+_pr 28419
+aji 28370
+ane 28323
+epä 28316
+lko 28250
+ltt 28218
+lvo 28188
+uok 28179
+pah 28150
+siv 28131
+ävi 28010
+nmu 27981
+_om 27978
+elk 27974
+anu 27950
+llu 27940
+sos 27924
+yte 27797
+uke 27716
+mpä 27678
+_ep 27635
+öön 27587
+_ja_ 596768
+sta_ 530669
+_on_ 519942
+aan_ 457591
+ssa_ 444261
+sen_ 392725
+että 378664
+ttä_ 360277
+_ett 351904
+ista 338071
+den_ 307582
+llis 294416
+lla_ 284221
+mme_ 282586
+ten_ 267970
+een_ 262103
+stä_ 253117
+nen_ 249535
+ksi_ 236398
+lle_ 230069
+sti_ 222440
+itä_ 221481
+utta 218518
+vat_ 212823
+iin_ 212379
+iden 208256
+taa_ 202660
+inen 202399
+ukse 201406
+ises 201382
+_ole 199815
+_toi 199155
+sest 194908
+ään_ 191869
+tava 190972
+ssä_ 188803
+isen 187929
+euro 185408
+_eur 185105
+tta_ 179116
+kin_ 177799
+llä_ 174278
+ien_ 173359
+_kan 171396
+uroo 169042
+roop 168336
+sia_ 167374
+tämä 164577
+taan 162432
+iste 162133
+asta 158726
+miss 154419
+_voi 154177
+sten 153447
+mise 152908
+istä 151697
+alli 147925
+_puh 144586
+tuks 143976
+_yht 143812
+issa 143616
+ksen 142520
+uksi 142367
+lais 142039
+_ei_ 140832
+usta 140493
+omis 140008
+_kom 138188
+_myö 137423
+_par 136984
+ille 136860
+teis 136039
+mist 135557
+_tar 135289
+aise 134958
+ittä 134253
+komi 134113
+aisi 134030
+yhte 133908
+_sii 133778
+itte 133593
+_mie 132969
+vast 132632
+tett 132308
+ttav 131544
+_val 129778
+puhe 129067
+oopa 128864
+esti 128629
+lise 127745
+toim 126515
+assa 125308
+issi 125102
+kans 125060
+seen 123566
+tää_ 122914
+pan_ 122078
+isuu 121595
+istu 121349
+_hal 120385
+_hyv 119048
+_kos 118894
+_jot 118348
+set_ 118330
+opan 118261
+valt 118219
+ssio 118008
+esta 116824
+_täm 115522
+tävä 115492
+kosk 114513
+äsen 114163
+otta 114079
+jäse 114049
+tami 113790
+_jäs 113119
+stel 112903
+_arv 112601
+oimi 111604
+dell 111459
+lisi 111408
+siin 111028
+ita_ 109388
+ella 109374
+list 109020
+emme 108716
+_esi 108641
+ansa 108575
+ttel 107605
+htei 107180
+ttaa 107120
+arvo 106072
+_vai 105999
+sin_ 105961
+isi_ 105277
+sitt 105154
+_asi 105062
+aist 104298
+essa 104287
+ment 104025
+_kui 103833
+amis 103820
+vois 103174
+uste 103173
+etta 102849
+maan 102792
+myös 102171
+jen_ 101851
+oitt 101730
+itta 101683
+_se_ 101244
+_nii 101199
+asia 100733
+estä 100545
+staa 100306
+_pää 99554
+amen 98235
+oike 97973
+_per 97800
+yös_ 96475
+parl 96385
+arla 96374
+lame 96371
+rlam 96337
+iitt 96335
+ava_ 96298
+alla 95771
+miel 95601
+_sit 95289
+eet_ 95249
+aikk 95068
+_eri 94649
+uude 94582
+nkin 94170
+_tie 94000
+_saa 93461
+_vuo 92582
+vät_ 91953
+_kai 91762
+kaik 90182
+elli 89341
+_vas 88827
+män_ 88474
+ttam 88461
+olli 88446
+oisa 88391
+_mei 87743
+tark 87628
+kais 87229
+_käy 86661
+rvoi 86296
+ovat 85553
+ion_ 85378
+_id_ 85001
+enti 84922
+ikeu 84869
+_oli 84820
+yksi 84684
+sess 84431
+_kes 83929
+iitä 83291
+halu 83091
+poli 82849
+alti 82538
+_huo 82462
+mies 82101
+_spe 82006
+ker_ 81996
+aker 81772
+emie 81759
+_jok 81701
+hyvä 81652
+name 81457
+_nam 81454
+ame_ 81409
+peak 81404
+spea 81400
+eake 81372
+ämä_ 80879
+_ova 80638
+neuv 80548
+euvo 80547
+sill 80374
+_sen 80194
+ltio 79937
+_teh 79881
+hemi 79842
+uhem 79808
+väli 79797
+ies_ 79602
+dän_ 79268
+illä 79262
+alai 79055
+enki 78916
+teen 78850
+_tul 78820
+alta 78779
+yttä 78689
+_maa 78159
+esit 78088
+tais 77827
+lta_ 77775
+ttäv 77477
+liit 77142
+isa_ 76821
+kaan 76819
+elle 76473
+kesk 76456
+joka 76434
+iten 76298
+_joi 76184
+käyt 75589
+nyt_ 75444
+essä 75169
+tään 74895
+illa 74676
+oske 74471
+ole_ 74306
+_työ 74199
+eksi 74057
+uden 73983
+man_ 73740
+uutt 73616
+telu 73535
+alua 73421
+_kys 73406
+nin_ 73255
+ohta 73155
+ehdo 72948
+ksia 72522
+_neu 72333
+_jos 72320
+idän 71889
+ykse 71738
+oita 71649
+_sel 71289
+sell 71212
+_oik 70917
+talo 70649
+_lii 70478
+eidä 70478
+tin_ 70453
+peru 70155
+oka_ 69894
+isia 69747
+päät 69433
+oide 69278
+van_ 69016
+puol 68863
+asti 68736
+alou 68730
+erus 68273
+lisu 67869
+_var 67777
+ioni 67615
+hdot 67567
+aika 67395
+muks 67229
+iset 67154
+_väl 67112
+_uni 66968
+tois 66888
+tust 66790
+unio 66706
+nion 66703
+sion 66429
+dist 66346
+amme 66198
+vost 66054
+eist 66038
+jotk 65897
+tenk 65614
+erit 65443
+ttää 65405
+oist 65281
+itse 65146
+_ehd 65135
+_suu 64463
+isin 64429
+kses 64059
+_san 63463
+nut_ 63244
+_vaa 63114
+osto 62912
+neet 62409
+muka 62073
+_muu 62030
+_kun 61969
+tama 61890
+sitä 61842
+_osa 61557
+tka_ 61505
+otka 61169
+osta 61093
+itet 60969
+atta 60864
+muut 60351
+anta 60337
+tiet 60101
+vall 60040
+ttäm 60021
+siit 60001
+uvos 59871
+ojen 59735
+olla 59655
+elma 59515
+enne 59404
+isii 59367
+äin_ 59247
+olis 59186
+_täs 59154
+_mit 59100
+mine 58686
+lest 58645
+ärje 58595
+väks 58529
+järj 58455
+arvi 58441
+_pit 58206
+skev 58153
+eill 58092
+etin 58006
+rity 57850
+ämän 57835
+len_ 57729
+isee 57441
+sopi 57415
+_oll 57356
+rjes 57303
+_näi 57246
+jest 57204
+ikka 57180
+iksi 57100
+rust 56880
+olem 56477
+ihin 56286
+hin_ 56266
+vaik 56209
+ossa 56107
+stam 56096
+_min 56075
+tyks 56071
+eide 55980
+_täy 55698
+miet 55325
+määr 55130
+_lan 55125
+joit 54976
+kuin 54906
+merk 54749
+ieti 54669
+_laa 54560
+ttei 54493
+kunn 54479
+sano 54376
+kset 54302
+amaa 54116
+lang 54090
+seks 54084
+ikki 54018
+_mut 53646
+stus 53477
+mutt 53454
+käsi 53353
+ntaa 53320
+meid 53308
+taja 53251
+_aik 53215
+tapa 53169
+olle 53147
+sist 53125
+ärke 53036
+tämi 52864
+ahdo 52814
+_alu 52657
+ntin 52595
+aisu 52526
+opim 52446
+oja_ 52387
+doll 52364
+huom 52341
+age_ 52305
+angu 52140
+ngua 52121
+guag 52103
+uage 52103
+kust 52017
+_tai 52014
+vali 51988
+joht 51971
+lman 51892
+etaa 51885
+ette 51733
+uite 51677
+pimu 51623
+mahd 51620
+_tuo 51560
+_lis 51304
+aine 51233
+_tal 51160
+nett 51142
+ton_ 51056
+ästä 51043
+kysy 50964
+yväk 50938
+eell 50907
+_käs 50710
+ässä 50695
+_kii 50685
+_tek 50599
+uomi 50537
+_pol 50501
+issä 50465
+ävä_ 50160
+uole 50059
+ällä 49971
+ellä 49906
+_vii 49823
+nsal 49822
+uin_ 49795
+äsit 49772
+äytt 49751
+tyis 49736
+lemm 49728
+suud 49715
+hdol 49527
+isek 49453
+_yhd 49437
+alue 49413
+ain_ 49349
+nan_ 49321
+_mah 49314
+_sil 49294
+lisä 49024
+_keh 49010
+line 48857
+ian_ 48827
+itii 48666
+oin_ 48634
+tiik 48620
+tila 48561
+voit 48370
+imuk 48355
+kuit 48342
+imme 48333
+_yks 48298
+_pal 48238
+kist 48188
+siä_ 48139
+_koh 48018
+dotu 47932
+esku 47909
+skus 47870
+ttis 47863
+ttäi 47812
+tärk 47750
+avat 47676
+erki 47555
+oitu 47507
+ksee 47418
+olit 47259
+astu 47183
+_vie 47176
+aati 47039
+onin 47025
+voim 46908
+llin 46898
+_tär 46897
+_tav 46775
+_kol 46750
+uuri 46681
+äisi 46607
+_tap 46469
+liti 46462
+_tod 46425
+anne 46363
+itel 46254
+_puo 46250
+ämis 46184
+stet 46039
+tele 45957
+isty 45838
+tiin 45837
+hän_ 45751
+ilma 45732
+nval 45696
+keva 45670
+ityi 45650
+aali 45573
+dess 45469
+tioi 45358
+pitä 45346
+auks 45284
+ysym 45189
+nist 45166
+enva 45082
+telm 45062
+_luo 44919
+avoi 44908
+site 44894
+ivat 44743
+iele 44592
+symy 44550
+koko 44525
+udel 44519
+este 44493
+leva 44493
+sall 44488
+tell 44422
+inta 44298
+itys 44244
+llee 44177
+itti 44129
+_sek 44110
+nsa_ 44109
+_mai 43993
+senv 43890
+eise 43844
+tule 43835
+unna 43663
+koht 43646
+uten 43611
+äätö 43601
+ana_ 43523
+ehit 43522
+olen 43522
+vin_ 43411
+äksy 43397
+ntti 43343
+stuk 43290
+_ilm 43213
+ota_ 43208
+entt 43120
+llai 43090
+itty 42963
+tai_ 42962
+heen 42851
+arki 42700
+kehi 42642
+nnet 42606
+anna 42319
+ämme 42286
+tti_ 42275
+_suo 42247
+niin 42235
+tode 42227
+mais 42090
+lain 42065
+suur 41922
+_täl 41890
+nnan 41874
+teta 41762
+_mää 41696
+ltä_ 41645
+ikan 41476
+eita 41456
+ivät 41309
+aatt 41220
+ensi 41171
+ettu 41162
+sään 41127
+leen 41011
+_kok 40982
+hall 40925
+kun_ 40886
+äärä 40613
+simm 40496
+_sam 40459
+_ase 40260
+_muk 40245
+mitä 40222
+siaa 40212
+_kuu 40059
+_mer 40010
+kkaa 39983
+ttee 39982
+oisi 39868
+uhee 39786
+oon_ 39748
+oill 39737
+omio 39631
+ritt 39622
+ksis 39577
+ioid 39549
+oopp 39548
+täll 39516
+eltä 39504
+_hän 39471
+sala 39462
+_ens 39444
+oppa 39432
+rist 39426
+sio_ 39409
+_sop 39353
+ekä_ 39306
+rkis 39304
+tely 39242
+_tur 39202
+kann 39191
+oksi 39173
+oida 39080
+matt 39035
+aihe 38948
+_kut 38931
+mene 38755
+ston 38740
+oska 38576
+vien 38536
+enet 38446
+akin 38348
+anss 38298
+etti 38223
+_til 38195
+_joh 38108
+olii 38076
+_ede 37967
+nka_ 37930
+_kor 37901
+_ain 37886
+jos_ 37757
+aino 37710
+hyvi 37689
+atka 37629
+täis 37616
+ttu_ 37613
+sekä 37520
+tus_ 37356
+iikk 37355
+nssa 37319
+min_ 37254
+_lai 37159
+voi_ 37093
+_men 37065
+ystä 37051
+_mon 36898
+mään 36878
+_sis 36862
+itus 36793
+sisä 36721
+kaa_ 36644
+imin 36579
+_ihm 36500
+_jär 36325
+tumi 36299
+mia_ 36269
+apau 36208
+_lop 36027
+_nyt 36023
+_tot 35996
+_kul 35974
+eles 35935
+ska_ 35860
+nest 35816
+kute 35682
+lous 35604
+rkki 35597
+_uud 35585
+_mui 35545
+minu 35459
+hmis 35258
+_läh 35243
+äksi 35233
+tied 35179
+ihmi 35178
+sama 35173
+iivi 35108
+yrit 35108
+ieli 35046
+ukai 35041
+täss 35005
+kan_ 34989
+eitä 34925
+myks 34917
+ituk 34910
+vain 34886
+ina_ 34860
+rkeä 34816
+yise 34814
+osal 34802
+unta 34672
+otuk 34616
+täin 34603
+tiiv 34561
+äni_ 34490
+yvin 34489
+mall 34486
+_jon 34473
+selv 34387
+laaj 34338
+suus 34297
+mass 34177
+emmi 34020
+itää 34012
+turv 33969
+urva 33919
+ityk 33776
+ikä_ 33741
+ätä_ 33601
+_ryh 33581
+jonk 33539
+nne_ 33501
+elmi 33495
+istö 33421
+_ant 33338
+tise 33325
+etää 33255
+alle 33254
+_ne_ 33231
+stan 33199
+koll 33069
+kään 33064
+otet 33063
+tarv 32966
+ttom 32916
+vist 32865
+teit 32751
+kirj 32750
+oiss 32749
+alis 32727
+täyt 32653
+oise 32622
+tavo 32567
+eura 32562
+isel 32522
+nta_ 32446
+tinn 32426
+mien 32418
+ryhm 32391
+esty 32313
+htaj 32291
+sien 32258
+pala 32245
+innö 32227
+tote 32162
+osia 32134
+teht 32042
+äise 32029
+rkit 31991
+älis 31933
+umis 31900
+void 31893
+isis 31871
+okun 31870
+ääne 31836
+arkk 31833
+kki_ 31805
+maa_ 31772
+_jo_ 31709
+_kau 31588
+seur 31579
+eisö 31552
+ielt 31544
+eutt 31518
+_seu 31500
+sias 31434
+_rah 31433
+stää 31413
+udes 31364
+ngel 31354
+mast 31345
+ielä 31344
+alio 31318
+uott 31313
+odel 31149
+uus_ 31134
+ioku 31079
+viel 31066
+onge 31036
+gelm 31031
+liok 31005
+kka_ 30906
+_ään 30896
+otte 30892
+vaa_ 30787
+autt 30749
+eivä 30746
+_tuk 30603
+lut_ 30596
+tia_ 30547
+luee 30534
+llit 30451
+vapa 30450
+edel 30443
+ena_ 30400
+inä_ 30353
+amin 30340
+_hei 30320
+elä_ 30310
+toiv 30288
+oli_ 30256
+ättä 30229
+siss 30221
+äntö 30168
+tuot 30164
+uais 30118
+suun 30058
+tyst 30031
+luai 30010
+nais 29978
+onka 29931
+_pai 29840
+tkai 29752
+aval 29580
+ustu 29498
+uuta 29488
+teli 29449
+eenj 29425
+_ker 29397
+_väh 29349
+_sää 29285
+daan 29214
+änes 29175
+kuul 29139
+oude 29119
+jan_ 29061
+ohje 28967
+njoh 28890
+suut 28875
+laus 28847
+ännö 28847
+aava 28841
+loud 28813
+mmin 28782
+ttii 28768
+_jäl 28765
+tua_ 28735
+tymi 28719
+ntee 28685
+kkin 28666
+unni 28665
+_mik 28549
+sioi 28521
+vaan 28493
+_eiv 28477
+stän 28464
+keus 28430
+_en_ 28378
+tyy_ 28355
+uosi 28350
+_aih 28343
+nnis 28310
+uun_ 28287
+olev 28271
+enjo 28245
+hen_ 28220
+ilan 28213
+_ong 28145
+_vak 28087
+aata 28054
+_tas 28037
+iika 28013
+elmä 28005
+_enn 27995
+ymis 27970
+nnit 27954
+_its 27917
+ktii 27904
+elij 27902
+kea_ 27867
+tte_ 27853
+elin 27852
+kent 27839
+rvio 27794
+_aja 27793
+suht 27766
+kyse 27696
+kert 27667
+_ott 27623
+ymyk 27616
+_tät 27567
+imie 27560
+ajat 27535
+oite 27488
+hoit 27480
+avan 27443
+ikke 27436
+mark 27430
+etty 27420
+iide 27418
+kast 27397
+kiin 27383
+huol 27370
+tuu_ 27351
+imus 27339
+peri 27328
+teid 27236
+jelm 27224
+koit 27208
+noma 27204
+_me_ 27170
+stäm 27146
+erra 27132
+immä 27128
+_ene 27120
+rin_ 27085
+asio 26994
+lint 26969
+idaa 26957
+ntam 26943
+ioit 26932
+lan_ 26890
+tätä 26877
+_epä 26819
+ente 26783
+tavi 26780
+hjel 26758
+yönt 26720
+_ver 26561
+tees 26545
+yhmä 26541
+nnös 26515
+_pid 26504
+isiä 26494
+jott 26450
+siks 26416
+töön 26412
+sian 26403
+ulla 26377
+stuu 26358
+äytä 26353
+aloi 26342
+oivo 26280
+meil 26247
+imen 26150
+htee 26088
+litu 26040
+evan 25993
+saan 25991
+ääri 25983
+maat 25979
+liik 25956
+utet 25934
+tamm 25885
+ihen 25864
+yvät 25860
+ikaa 25858
+ttai 25840
+inoi 25821
+ästi 25815
+_rat 25796
+soit 25756
+sity 25727
+uonn 25682
+ulut 25637
+mite 25627
+kohd 25626
+arko 25612
+iihe 25604
+siih 25596
+ajan 25589
+uute 25558
+tyvä 25476
+enem 25472
+ähän 25471
+via_ 25456
+_yri 25439
+sval 25420
+kein 25390
+ussa 25238
+eude 25202
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/el.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/el.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/el.ngp (working copy)
@@ -1,1002 +1,3064 @@
-# NgramProfile generated at Sat Sep 25 16:05:37 EEST 2004 for Nutch Language Identification
-ngram_count 19363906
-_ 1286833
-α 656423
-Ï„ 541287
-ο 535322
-ε 501143
-ι 492230
-ν 432414
-σ 325963
-Ï€ 315357
-Ï 312383
-η 277918
-κ 256032
-Ï… 244848
-μ 243509
-Ï‚ 237695
-Ï‚_ 237630
-α_ 200965
-λ 167133
-ν_ 167047
-ί 161180
-ι_ 147823
-ό 145063
-Î 127287
-ω 124482
-ά 119015
-ου 117981
-δ 112546
-γ 109721
-τη 108265
-ή 104451
-το 102485
-θ 88360
-πο 87701
-να 86016
-αι 85768
-ε_ 83152
-κα 81551
-ο_ 81153
-η_ 80781
-τα 78966
-στ 75811
-Ï 74782
-ικ 73336
-ει 73317
-αι_ 73253
-χ 72116
-τι 71395
-με 66544
-ια 64266
-Ï…_ 62582
-Ïο 62071
-ÏŽ 60978
-ου_ 58102
-ση 55914
-Ï€Ï 54437
-φ 54300
-αν 53314
-ης 50990
-ης_ 50881
-εί 50644
-ων 49161
-ατ 48192
-β 47067
-μα 45831
-και 44545
-ων_ 42202
-ή_ 41768
-ÎµÏ 41382
-τε 40440
-οι 40366
-ια_ 39921
-σε 39875
-Ïι 39415
-ην 39397
-δι 38341
-νο 38026
-ό_ 37780
-ην_ 37370
-απ 36941
-ον 36695
-την 36472
-ία 36445
-Î¿Ï 36136
-επ 35412
-ισ 35339
-ά_ 35043
-ση_ 33907
-υν 33838
-εν 32717
-ει_ 32401
-Ïα 32366
-πε 32199
-συ 31296
-τικ 31117
-του 31099
-ασ 30790
-ότ 30769
-πα 30674
-ντ 30499
-της 29811
-Î±Ï 29651
-ας 29551
-ας_ 29127
-τω 29065
-Î¿Ï 28618
-οπ 28609
-γι 27920
-ετ 27789
-κο 27722
-πι 27538
-ξ 27210
-ολ 26690
-θε 26675
-υμ 26392
-Ï€Ïο 25990
-λο 25854
-ις 25681
-ις_ 25675
-Ï…Ï„ 25535
-κή 25534
-Îν 25515
-ευ 25410
-ία_ 25301
-ιο 25252
-ες 24640
-ες_ 24630
-των 24440
-ών 24325
-που 24082
-ίν 24012
-μΠ23557
-Ï„Ï 23274
-αυ 22951
-Ïε 22314
-ί_ 22189
-δε 21751
-νε 21725
-ιτ 21695
-για 21684
-με_ 21455
-αυτ 21185
-ών_ 20925
-ζ 20910
-λε 20691
-ημ 20584
-πό 20426
-ομ 20082
-ική 20053
-Ï…Ï 20018
-μο 19717
-αλ 19453
-μι 19423
-επι 19352
-Ïά 19181
-Ïί 18996
-κά 18923
-στη 18905
-ÏÏŒ 18889
-ής 18677
-ής_ 18665
-ησ 18649
-λι 18637
-θα 18593
-σο 18534
-τό 18386
-τα_ 17610
-ελ 17364
-Ï…Ï€ 17349
-ται 17329
-τή 17202
-ματ 16894
-ος 16877
-ος_ 16872
-λλ 16871
-ται_ 16831
-σμ 16764
-ÎÏ‚ 16673
-Ïω 16669
-ιν 16665
-ÎÏ‚_ 16661
-δια 16531
-Ï…Ï‚ 16512
-Ï…Ï‚_ 16509
-σει 16489
-ους 16463
-είν 16459
-ους_ 16459
-κατ 16415
-κό 16369
-τά 16350
-ως 16295
-τι_ 16159
-κή_ 16055
-νω 15966
-ον_ 15956
-ητ 15952
-χ_ 15795
-στο 15711
-οσ 15623
-κε 15577
-οπο 15572
-πολ 15525
-Ï_ 15096
-εί_ 14913
-σης 14828
-σης_ 14821
-ότι 14817
-ναι 14699
-ίνα 14581
-λα 14557
-ουμ 14531
-είνα 14362
-υμε 14346
-από 14186
-ναι_ 14171
-ίναι 14167
-ουμε 14152
-αφ 14131
-υμε_ 14129
-ÎºÏ 14088
-νι 13916
-ίσ 13888
-εσ 13878
-τις 13852
-φο 13742
-λη 13714
-ω_ 13578
-εκ 13538
-Ï€Î±Ï 13503
-ουν 13481
-ως_ 13391
-υν_ 13388
-ατα 13313
-συν 13188
-αγ 13175
-Ï€ÎµÏ 13128
-ετα 13106
-ÏÎ 13090
-ική_ 13087
-πό_ 13053
-ακ 13039
-άλ 12981
-ωσ 12928
-σι 12871
-Ï„Ïο 12829
-ιο_ 12784
-οτ 12690
-βο 12678
-οί 12672
-Ïν 12614
-άσ 12554
-μÎν 12474
-ντα 12467
-μα_ 12388
-ήσ 12245
-ηση 12209
-Ïοπ 11987
-αί 11985
-εÏι 11865
-κά_ 11788
-ÎÏ 11764
-ιστ 11746
-εν_ 11742
-απο 11710
-Ïγ 11669
-σα 11607
-τον 11604
-αμ 11581
-ικά 11567
-ÎµÏ…Ï 11565
-ικά_ 11389
-δεν 11364
-ουν_ 11215
-ιμ 11159
-πει 11098
-υσ 11086
-ιε 11081
-ÏÏŽ 11062
-Ï€ÏÏŒ 11044
-εις 11034
-μπ 11017
-εις_ 10872
-ογ 10851
-Ï„Ïοπ 10796
-ÎÏ€ 10760
-Ï„ÎµÏ 10760
-ψ 10757
-ίο 10721
-το_ 10663
-όσ 10633
-θΠ10619
-ανα 10529
-γο 10500
-όν 10446
-ωπ 10430
-τό_ 10385
-ίας 10369
-αντ 10365
-ίας_ 10360
-όμ 10310
-πί 10293
-σί 10278
-τική 10270
-την_ 10197
-να_ 10075
-Îσ 10069
-ικό 10049
-στην 10031
-οιν 9987
-τε_ 9987
-Îλ 9984
-άν 9964
-νη 9926
-πλ 9856
-πιτ 9846
-επιτ 9806
-μό 9798
-Ïα_ 9767
-κοι 9750
-κοιν 9624
-Ï†Î¿Ï 9615
-δη 9509
-οÏ_ 9452
-οβ 9379
-συμ 9361
-ημα 9329
-εξ 9315
-άτ 9301
-Îπε 9263
-στι 9263
-εδ 9248
-τους 9224
-κής 9207
-κής_ 9207
-οκ 9202
-Ï„Î 9199
-ισμ 9165
-σεις 9135
-Î´Ï 9109
-ποί 9103
-αν_ 9098
-Ïη 9098
-ωση 9064
-οδ 9032
-υτό 9009
-αυτό 9006
-πεÏι 8971
-ηση_ 8953
-Îπει 8949
-οποί 8941
-οντ 8911
-βα 8880
-μια 8832
-Ï„ÏŽ 8825
-Îνα 8815
-Î·Ï 8639
-τη_ 8624
-δικ 8605
-σου 8569
-γε 8538
-δο 8474
-Ïισ 8473
-κό_ 8446
-αθ 8415
-λά 8378
-Î¹Ï„Ï 8347
-ικο 8332
-στα 8304
-Ï€Î¹Ï„Ï 8299
-εγ 8291
-στε 8266
-οÏν 8262
-Ïωπ 8246
-τά_ 8235
-Î¬Ï 8234
-πει_ 8189
-νό 8165
-Ï_ 8135
-όλ 8130
-Ï‡Ï 8102
-χε 8063
-ÏÎÏ€ 8012
-ÏŠ 7953
-τητ 7885
-μά 7826
-ÏÎπε 7822
-αστ 7791
-πή 7783
-Ï€Î¿Ï 7719
-μη 7693
-μβ 7681
-ίζ 7678
-γκ 7677
-εται 7677
-μετ 7665
-Ïοσ 7661
-λί 7650
-νου 7649
-πά 7642
-ίτ 7633
-κτ 7628
-e 7623
-υτό_ 7597
-σω 7592
-Ï€Ïοσ 7569
-Îχ 7550
-Ï€ÏÎ 7534
-πω 7523
-ολο 7516
-Ï€ÏÎÏ€ 7516
-εω 7515
-κΠ7508
-Ï…Ïω 7488
-γα 7480
-σία 7480
-Ïμ 7466
-ότη 7463
-ιδ 7451
-ευÏω 7421
-ατο 7407
-φα 7366
-ωπα 7340
-Ïωπα 7309
-Ï…Ïωπ 7306
-χο 7283
-ÎµÏ 7281
-νομ 7248
-ντι 7234
-αϊ 7169
-ικα 7168
-ϊκ 7164
-οι_ 7156
-ιτÏο 7150
-υλ 7122
-Ïσ 7122
-κώ 7109
-οπή 7088
-αϊκ 7081
-Ï‰Ï 7055
-ποι 7043
-τί 7022
-σει_ 7013
-Ïοπή 7008
-νά 6998
-ιά 6981
-τικά 6974
-Ïν_ 6972
-οÏν_ 6958
-ÏŽ_ 6945
-πτ 6934
-μπο 6902
-ικό_ 6884
-ικής 6877
-επί 6861
-ός 6816
-ός_ 6816
-παϊ 6811
-ωπαϊ 6809
-όπ 6802
-παϊκ 6797
-λογ 6789
-ÏÏ 6789
-ατά 6787
-ιώ 6787
-ολι 6784
-γί 6737
-τασ 6735
-ίε 6727
-ότητ 6703
-οντα 6700
-αλλ 6679
-θεσ 6665
-ώσ 6656
-κών 6651
-λΠ6640
-κών_ 6627
-εια 6594
-κατα 6586
-νικ 6582
-νΠ6559
-θεί 6549
-ασί 6533
-Î»Ï 6506
-λή 6501
-Ïά_ 6489
-ατι 6483
-οφ 6466
-Î¼Ï€Î¿Ï 6463
-κÎÏ‚ 6440
-κÎÏ‚_ 6436
-ήτ 6426
-ατα_ 6390
-βά 6385
-υτή 6360
-τή_ 6359
-ίες 6350
-ίες_ 6347
-a 6304
-γμ 6295
-αση 6292
-αφο 6286
-ψη 6263
-σημ 6261
-ήμ 6251
-αÏα 6220
-θεί_ 6201
-αντι 6197
-νει 6176
-νο_ 6175
-ητα 6158
-κατά 6155
-όσο 6143
-ηε 6124
-υπο 6121
-άλλ 6114
-ήσε 6111
-ÎÏ„ 6110
-νται 6102
-ωση_ 6026
-ινο 6004
-Î¹Ï 5986
-εμ 5972
-Îνω 5956
-αυτή 5952
-ικΠ5940
-ξε 5922
-ικώ 5913
-τητα 5883
-ματα 5880
-ικÎÏ‚ 5871
-σκ 5818
-νων 5777
-ηγ 5765
-ωτ 5762
-ικών 5759
-σχ 5752
-ίου 5748
-αδ 5734
-r 5709
-καν 5669
-δικα 5654
-ίω 5651
-μμ 5645
-τικό 5642
-ηκ 5620
-ÎºÎ¿Ï 5580
-Î³Ï 5571
-τος 5571
-τος_ 5571
-ÏŽÏ‚ 5553
-βου 5550
-ξη 5544
-ÏŽÏ‚_ 5541
-οÏμ 5535
-ετι 5498
-ουλ 5496
-πως 5491
-λό 5487
-μας 5486
-πισ 5471
-οτε 5468
-σουμ 5462
-λιτ 5457
-θο 5453
-ποτ 5441
-Î±Ï†Î¿Ï 5436
-μικ 5433
-ετικ 5429
-ÏŽÏ 5417
-αξ 5401
-πολι 5394
-παÏα 5390
-ÏÏ„ 5390
-ολιτ 5385
-ιτι 5374
-ίου_ 5366
-o 5365
-ιση 5343
-εÏα 5333
-ÏÏι 5289
-Ïμε 5282
-οÏμε 5279
-ασία 5260
-μί 5248
-οινο 5242
-ÎºÏ 5231
-κυ 5223
-ταν 5183
-χα 5170
-ζο 5160
-ÏÎ¿Ï 5121
-νδ 5104
-Ïή 5101
-νί 5093
-Ïία 5071
-n 5068
-οÏά 5067
-τελ 5063
-ατικ 5033
-λά_ 5027
-Ïο_ 5020
-των_ 5010
-Ï„Î¿Ï 4969
-γμα 4959
-σ_ 4932
-ελε 4916
-άδ 4902
-λου 4886
-νισ 4864
-ζε 4856
-ματο 4852
-αση_ 4848
-ÏƒÏ 4844
-ήσει 4843
-Ïατ 4843
-νει_ 4835
-βουλ 4825
-ÎµÎ´Ï 4822
-υθ 4820
-Ï„Ï… 4812
-δυ 4811
-υγ 4806
-λω 4805
-μεν 4786
-ότε 4779
-οβο 4773
-πή_ 4742
-θη 4736
-καθ 4730
-ματι 4730
-Îνο 4724
-βλ 4722
-Î¼ÎµÏ 4719
-όγ 4715
-υτή_ 4712
-λει 4710
-λλο 4697
-σο_ 4683
-πη 4678
-Ïλ 4672
-λευ 4661
-νωσ 4657
-ολογ 4653
-υνα 4646
-κλ 4645
-Ïικ 4636
-Ïιο 4628
-λιτι 4623
-κÏÏ 4613
-οπή_ 4613
-μÎνο 4602
-Ïγα 4602
-Îμ 4579
-i 4573
-νθ 4570
-νώ 4570
-εÏγ 4564
-εων 4553
-εων_ 4546
-λα_ 4533
-κÏÏι 4522
-ιλ 4514
-φΠ4514
-Ïου 4498
-τησ 4486
-ομι 4483
-μετα 4480
-εση 4477
-ιτικ 4469
-κÏι 4424
-σία_ 4401
-χει 4356
-ηθ 4350
-άπ 4337
-γή 4332
-ητα_ 4330
-Ïμε_ 4329
-μφ 4325
-άσε 4313
-οÏι 4295
-χώ 4292
-Î²Î¿Ï 4281
-Îκ 4277
-σεω 4276
-φε 4275
-νωση 4265
-υμβ 4246
-συμβ 4243
-σφ 4239
-λλά 4236
-τών 4199
-ανά 4197
-οÏά_ 4186
-ομΠ4183
-δημ 4179
-ωμ 4175
-εÏο 4173
-νη_ 4172
-νή 4153
-Ïιε 4152
-Î¼Î¿Ï 4145
-Î®Ï 4143
-σή 4141
-ίνε 4125
-οστ 4115
-ÏŽÏ€ 4114
-απα 4093
-σμο 4088
-οικ 4087
-ÏŒÏ 4068
-σεων 4064
-ηλ 4061
-στικ 4057
-εÏα_ 4053
-ήθ 4044
-Ï„Î·Ï 4044
-ονο 4037
-βε 4025
-ήμα 4023
-μεί 4020
-τάσ 3998
-αποτ 3994
-υνε 3994
-τας 3963
-γω 3962
-τας_ 3961
-γματ 3947
-άγ 3939
-οÏλ 3935
-ιών 3934
-Ïαγ 3916
-τομ 3914
-ιβ 3904
-ατά_ 3889
-τεί 3884
-Î¿Ï…Ï 3880
-ιε_ 3874
-Î¸Ï 3873
-Ïιε_ 3864
-βοÏλ 3862
-τις_ 3861
-σημα 3860
-γία 3859
-λόγ 3858
-ιό 3857
-ξα 3855
-Ïος 3846
-Ïος_ 3846
-θÎσ 3844
-ϊκή 3842
-κοÏ_ 3840
-ιμΠ3834
-φοÏά 3832
-οÏο 3830
-Ï€Î¬Ï 3827
-στις 3824
-ποτε 3822
-δα 3817
-αϊκή 3811
-ντικ 3808
-ÏŒÏ„ÎµÏ 3806
-καλ 3795
-Ïλι 3794
-λλά_ 3792
-γν 3791
-Ïμ 3780
-οÏε 3778
-τών_ 3768
-χή 3768
-l 3767
-εια_ 3760
-νοβ 3752
-τήσ 3752
-συνε 3751
-κει 3748
-ινοβ 3740
-νοβο 3738
-ίδ 3728
-Î¿Î»Ï 3719
-όε 3719
-πιστ 3715
-φω 3691
-ιας 3688
-ιας_ 3688
-Ïόε 3687
-ίς 3686
-Ïία_ 3685
-Ïόεδ 3685
-όεδ 3685
-ίς_ 3684
-μου 3684
-Ï€Ïόε 3684
-διά 3683
-ÏŒÎµÎ´Ï 3683
-νομι 3682
-στε_ 3681
-ομικ 3668
-Ïει 3660
-σω_ 3642
-λιο 3639
-ιδι 3634
-σμό 3633
-πΠ3623
-ÏÏιε 3623
-ημα_ 3622
-τηση 3620
-οÏλι 3616
-Ï€Î¿Î»Ï 3611
-ίπ 3606
-αÏά 3604
-Î¸Î¿Ï 3602
-νες 3602
-νες_ 3600
-Ïεί 3581
-λιο_ 3573
-λη_ 3568
-σσ 3568
-ιμÎν 3565
-κον 3557
-ταση 3556
-γÏα 3549
-πίσ 3535
-σε_ 3529
-στό 3525
-αμε 3515
-αλλά 3507
-Ïε_ 3504
-οικο 3494
-ιπ 3493
-Ï€Ïα 3480
-Ïτε 3478
-ÏÏ‚ 3473
-δÏε 3471
-ÏÏ‚_ 3471
-ανο 3467
-θεση 3466
-ιθ 3459
-θυ 3456
-Ïλιο 3455
-εση_ 3444
-ίο_ 3442
-δί 3441
-Î¹ÎºÎ¿Ï 3441
-οία 3440
-πως_ 3437
-Ï„ÎÏ‚ 3431
-Ï„ÎÏ‚_ 3430
-σμα 3428
-ονομ 3427
-Î_ 3417
-τον_ 3417
-σα_ 3413
-ευτ 3410
-φÎÏ 3408
-νων_ 3400
-υπά 3396
-άσει 3392
-μη_ 3391
-ξη_ 3391
-εθ 3389
-εδÏε 3383
-οÏÏ‚ 3375
-οÏÏ‚_ 3374
-ποία 3350
-γά 3323
-ιακ 3319
-συγ 3316
-Îνωσ 3315
-ÏÏŽÏ€ 3303
-s 3300
-εÏγα 3298
-δυν 3294
-τες 3292
-τες_ 3290
-Ïες 3288
-Ïες_ 3288
-οποι 3287
-χου 3273
-φων 3268
-ουσ 3258
-υλί 3239
-διε 3237
-ιών_ 3227
-οία_ 3225
-ημε 3223
-άτω 3220
-Ï…Ï€Î¬Ï 3209
-Ïοπο 3208
-ταν_ 3198
-t 3196
-Ï‡ÏŽÏ 3194
-εξα 3189
-όνο 3189
-δÏε_ 3184
-οÏÎ¿Ï 3182
-ατος 3181
-ÏƒÎ¼Î¿Ï 3179
-λώ 3175
-άθ 3160
-όπω 3158
-ίζο 3156
-εία 3155
-Ïοτ 3146
-αβ 3142
-μασ 3138
-ουλί 3137
-Îα 3131
-τεÏο 3129
-ησης 3125
-μαν 3123
-μάτ 3122
-ÎºÏ…Ï 3120
-Ïίζ 3119
-ώσε 3117
-ότα 3116
-τικΠ3109
-ήματ 3108
-άζ 3101
-Ï…ÏÏŽ 3096
-ήσο 3087
-άμ 3082
-όπως 3077
-φι 3074
-λÏ_ 3071
-ήσου 3070
-ολÏ_ 3068
-αγμ 3066
-ηπ 3066
-ιότ 3066
-μω 3066
-τημ 3066
-οτελ 3065
-μό_ 3064
-κι 3062
-ποσ 3059
-παÏά 3058
-ηεπ 3057
-εφ 3052
-επε 3043
-ωσης 3035
-όπο 3033
-κθ 3031
-νία 3009
-ίμ 3006
-διο 3003
-Ïήσ 3003
-εκτ 3002
-νον 2999
-τελε 2999
-Ïότ 2998
-Îσε 2994
-οθ 2992
-σπ 2989
-μβο 2984
-οÏί 2979
-ίτε 2974
-ιω 2974
-τοι 2964
-ζη 2960
-ηφ 2948
-Ïσε 2946
-ίση 2940
-λεί 2933
-ήτη 2930
-στον 2929
-ιατ 2928
-λικ 2928
-δή 2927
-όλο 2927
-χω 2924
-ταξ 2917
-βασ 2915
-ισμό 2902
-ισμο 2898
-ψη_ 2896
-μία 2894
-στή 2894
-Ï…Ïί 2894
-φά 2894
-μή 2891
-θηκ 2890
-όσο_ 2877
-ÏŽÏ„ 2875
-ίζε 2863
-σίας 2858
-μεγ 2857
-μάτω 2853
-ζου 2849
-τιμ 2845
-ιση_ 2844
-ωνι 2842
-Ïη_ 2840
-εσμ 2838
-εÏί 2837
-νατ 2836
-κÏα 2833
-ήθε 2831
-αγμα 2831
-άÏ_ 2822
-Ïάτ 2822
+# NgramProfile generated at Tue May 31 01:15:37 CEST 2005 for Nutch Language Identification
+α 9693921
+Ï„ 8019526
+ο 7805083
+ε 7405170
+ι 7257346
+ν 6309150
+σ 4808927
+Ï 4643904
+Ï€ 4629485
+η 4164730
+κ 3767750
+μ 3625827
+Ï… 3582036
+Ï‚ 3516703
+λ 2486763
+ί 2440773
+ό 2168463
+Î 1879708
+ω 1806637
+ά 1727512
+δ 1656883
+γ 1648946
+ή 1561880
+θ 1319738
+Ï 1092012
+χ 1047524
+ÏŽ 880956
+φ 787670
+β 691743
+e 677468
+a 493104
+ξ 397078
+n 361857
+p 351202
+o 329077
+r 314553
+s 307106
+ζ 302139
+i 301240
+d 207042
+t 200957
+l 198724
+m 178995
+u 167358
+ψ 161547
+c 129579
+ÏŠ 120819
+v 118761
+g 114455
+k 97831
+h 61683
+b 54122
+f 45018
+q 23557
+Ï‹ 22452
+y 18848
+j 17301
+z 15722
+w 13359
+x 10956
+ΰ 6791
+Î 1971
+ʼ 1
+Ï‚_ 3516215
+α_ 2963392
+_Ï„ 2869973
+ν_ 2442703
+ι_ 2175574
+_Ï€ 1931033
+_ε 1784154
+ου 1693237
+_α 1657768
+τη 1620987
+_σ 1615087
+_κ 1575457
+η_ 1555729
+το 1512620
+πο 1260195
+αι 1245817
+να 1244616
+ο_ 1223925
+κα 1191838
+ε_ 1159774
+τα 1138250
+στ 1107314
+ει 1087710
+τι 1081250
+_μ 1075899
+ικ 1070720
+με 969849
+ια 923863
+Ïο 919044
+_δ 860746
+Ï…_ 855405
+ση 845825
+Ï€Ï 824677
+αν 779690
+ης 762176
+εί 751875
+_ν 728741
+ατ 719173
+μα 693098
+ων 692887
+ή_ 656768
+τε 609212
+ÎµÏ 608553
+ην 599652
+_ο 591158
+ία 583651
+σε 578522
+οι 577965
+δι 559200
+Ïι 559001
+απ 550949
+νο 547449
+ό_ 541841
+ον 533178
+Î¿Ï 524882
+επ 520261
+ισ 520235
+_γ 511343
+ά_ 498504
+υν 494402
+Ïα 488026
+εν 471903
+_ό 470921
+συ 469534
+πε 458816
+ότ 456175
+ασ 452864
+πα 452614
+_Î 451552
+ας 439291
+ντ 439003
+_θ 438542
+Î±Ï 429331
+γι 426634
+Î¿Ï 411363
+πι 409017
+τω 407696
+_η 407043
+ετ 406932
+οπ 406347
+θε 399532
+ολ 393223
+κο 392236
+υμ 391207
+λο 388922
+κή 385014
+ις 383337
+Ï…Ï„ 376655
+ευ 371238
+ες 365745
+Îν 365125
+ιο 359880
+Ï„Ï 348335
+ών 347526
+μΠ346097
+ίν 344833
+αυ 335873
+νε 331240
+Ïε 328652
+ιτ 327773
+δε 319710
+ί_ 303641
+λε 303479
+πό 300738
+ÏÏŒ 300055
+Ï…Ï 299524
+ομ 295526
+ημ 292330
+Ïί 290797
+μο 289528
+αλ 288485
+λι 281257
+ής 279418
+Ïά 279141
+θα 278958
+τό 272019
+κά 267763
+_Ï… 266088
+μι 262301
+ελ 260118
+σο 258851
+ος 257442
+ησ 255956
+τή 255562
+Ï…Ï€ 255431
+λλ 252361
+Ïω 250310
+σμ 248113
+ιν 246194
+ÎÏ‚ 244543
+_p 243254
+τά 241655
+κό 240938
+Ï…Ï‚ 236029
+νω 229520
+ητ 227292
+ως 227237
+χε 225758
+e_ 220154
+κε 219867
+_χ 217807
+οσ 216677
+λα 214591
+ÎºÏ 209876
+ίσ 209368
+λη 209026
+εσ 207851
+Ï_ 205801
+ω_ 204143
+νι 199137
+αφ 197962
+φο 195980
+αγ 195946
+p_ 193168
+ωσ 192217
+ÏÎ 190590
+άλ 190504
+_β 190361
+εκ 188890
+βο 188210
+ακ 188076
+Ïγ 187278
+οί 185248
+αμ 182034
+αί 181913
+Ïν 181893
+_λ 181451
+άσ 180962
+σι 179477
+ήσ 177665
+οτ 176829
+ÎÏ 175811
+σα 174812
+μπ 168744
+ίο 165150
+ιε 164934
+ογ 161816
+υσ 160997
+εδ 156382
+ωπ 156227
+γο 156033
+Îχ 155834
+ÎÏ€ 155769
+σί 155491
+χο 153939
+Î´Ï 153855
+όμ 153464
+ÏÏŽ 153305
+θΠ153011
+όσ 151474
+σχ 151396
+Îσ 150151
+όν 149615
+Îλ 149547
+άν 147652
+πί 145887
+μό 142951
+ιμ 142929
+νη 142690
+πλ 141431
+εξ 139656
+δη 134269
+Ïη 133416
+οβ 132497
+Ï„Î 132479
+γε 130433
+Ï„ÏŽ 128338
+βα 127387
+er 126124
+άτ 124984
+οδ 124323
+λά 123480
+εγ 122248
+Î·Ï 121944
+δο 121838
+πή 121462
+μβ 121392
+r_ 119913
+όλ 119736
+Î¬Ï 119307
+νό 119080
+_ι 118344
+αθ 117970
+Ï‡Ï 117481
+μη 117407
+ÎµÏ 115575
+_ά 115368
+γα 115075
+πά 114880
+ίτ 114796
+_ή 113949
+λί 113866
+σω 113364
+μά 112422
+_s 111975
+κΠ111800
+οκ 111533
+ίζ 111176
+εω 110797
+κτ 110670
+γκ 110460
+_φ 110274
+ϊκ 108555
+αϊ 108249
+φα 107610
+κώ 105757
+ίε 105171
+μί 104872
+Ï‰Ï 104311
+ιδ 104261
+τί 104236
+υλ 103909
+Ïσ 103763
+Ïμ 103523
+πω 102510
+όπ 101405
+νά 101326
+γί 101169
+ιά 100861
+s_ 99772
+Ïχ 99625
+ÏÏ 99571
+ώσ 98821
+πτ 98581
+ός 98268
+ÏŽ_ 96905
+νΠ96230
+Î¹Ï 95662
+λΠ95137
+Î»Ï 94604
+ήμ 94211
+γμ 93964
+ψη 93283
+me 93168
+λή 92864
+ÎÏ„ 92507
+_n 91313
+ιώ 91127
+_i 90761
+βά 89889
+οφ 89560
+εμ 89301
+ξε 87152
+σκ 86025
+d_ 85520
+ήτ 85511
+μμ 84762
+νί 83984
+ωτ 83481
+θο 82651
+ίω 82559
+αδ 82369
+Î³Ï 81862
+ÏŽÏ 81445
+ÏŽÏ‚ 80601
+χα 80488
+na 79482
+pe 79400
+λό 78792
+id 78708
+ξη 78425
+ηγ 77989
+am 77624
+Ïλ 77126
+an 76902
+Ïή 76471
+ÏÏ„ 75950
+κυ 75873
+θη 75814
+_l 75581
+αξ 74933
+άδ 74170
+ÎºÏ 73420
+νδ 73284
+_d 73166
+ea 71955
+κλ 71876
+όε 71556
+sp 71326
+Îκ 71191
+δυ 70803
+ke 70593
+μφ 70277
+όγ 70151
+ζο 69945
+n_ 69537
+ζε 69028
+Îμ 69010
+ÏƒÏ 68877
+Ï„Ï… 68858
+ak 68440
+οχ 68075
+πη 67752
+κ_ 67705
+λω 67381
+υθ 66486
+υγ 66374
+βλ 66066
+νή 65619
+νθ 65601
+φΠ65374
+υχ 65226
+en 65221
+νώ 65098
+ιλ 64085
+ÏŒÏ 63480
+γή 63323
+Î®Ï 62974
+χώ 62858
+_e 62742
+ηθ 62327
+άπ 61849
+la 61730
+σφ 61725
+_ω 61306
+βε 60931
+φε 60767
+ήθ 60745
+ωμ 60524
+φω 60424
+_ζ 60203
+σή 60045
+ηκ 59666
+Ïμ 59286
+ιό 59237
+γω 57318
+ιβ 57207
+άγ 57196
+ξα 57127
+ÏŽÏ€ 56739
+γν 56620
+ίς 56268
+de 55662
+δα 55409
+ηλ 55102
+χή 54973
+es 54270
+εχ 54103
+o_ 54051
+Î¸Ï 53971
+εθ 53948
+a_ 53628
+ίδ 53568
+_c 53549
+πΠ53286
+χω 51981
+ιπ 51744
+κθ 51735
+δί 51471
+on 50867
+ÏÏ‚ 50604
+ίπ 50358
+t_ 49580
+θυ 48911
+άθ 48832
+_a 48607
+χΠ48546
+σσ 47977
+ιθ 47865
+λώ 47628
+γά 47556
+άμ 46355
+Îα 45995
+σπ 45406
+όχ 44680
+φι 44662
+οθ 44631
+εφ 44198
+κι 44052
+αβ 43975
+ίμ 43929
+χι 43881
+μω 43457
+φά 43425
+ηφ 42982
+μή 42889
+ge 42459
+ζη 42222
+ιχ 41987
+ng 41923
+_Ï 41668
+re 41042
+δή 40939
+Ïο 40899
+γη 40711
+θή 40653
+Î´Ï 40320
+Î²Ï 40137
+Ïκ 39874
+άζ 39529
+Îγ 39382
+ÏŽÏ„ 39311
+ώμ 38773
+κη 38732
+ÏÏ… 38562
+ζή 38551
+nt 38468
+Ïθ 38332
+ιω 37919
+ag 37807
+σό 37800
+le 37732
+te 37427
+ιγ 37420
+gu 37052
+ζω 36942
+_ψ 36844
+θμ 36556
+_m 36353
+υξ 36218
+Ïν 36031
+ua 35893
+δώ 35737
+υζ 35719
+in 35457
+ÏÏ„ 35278
+σθ 35151
+θν 34901
+αχ 34546
+ξι 34102
+όκ 33965
+χθ 33862
+γγ 33632
+_ί 33523
+βι 32855
+ar 32240
+v_ 31468
+ÏÏ 31363
+γχ 31356
+ίχ 31137
+co 31105
+θώ 31025
+φί 30853
+Ïθ 30666
+άς 30634
+ήν 30462
+οε 30058
+ήκ 30041
+λυ 29796
+φή 29465
+Î¯Ï 29171
+Ï†Ï 29015
+Îο 28978
+χί 28962
+κί 28943
+νσ 28739
+ξο 28458
+_b 27818
+εβ 27614
+ίκ 27490
+χν 27229
+δΠ27095
+l_ 27067
+_f 26839
+ro 26470
+ίη 26332
+υκ 26215
+_ÏŽ 25923
+Îδ 25702
+ti 25656
+οψ 25541
+πώ 25370
+ψε 25323
+_ξ 25212
+χό 25147
+_v 25001
+Î¾Ï 24921
+ra 24877
+αζ 24492
+is 24475
+ωθ 24126
+ÏÏ 24011
+ίθ 23973
+ÏÏ€ 23794
+φυ 23790
+se 23715
+άξ 23672
+ma 23622
+ιξ 23412
+φό 23353
+άβ 23267
+υβ 23134
+ωγ 23105
+γώ 23077
+ιφ 23054
+ne 22949
+qu 22590
+_o 22496
+Ï‡Ï 22384
+ns 22361
+or 22324
+φθ 22293
+ur 22263
+st 22223
+Ï„Ï 22174
+_t 22148
+κπ 22129
+όδ 22004
+ίγ 21994
+δό 21985
+εά 21916
+it 21819
+i_ 21772
+οϋ 21610
+ch 21453
+Ï‹Ï€ 21391
+el 20901
+ri 20769
+γό 20753
+oÏ… 20470
+λφ 20326
+χυ 20317
+βΠ20270
+τσ 20141
+όψ 20113
+ίλ 20082
+ιΠ20067
+_r 19966
+al 19863
+ta 19686
+άφ 19629
+Ïω 19607
+γΠ19486
+χά 19438
+Ïε 19381
+ou 19327
+όφ 19171
+ue 18840
+io 18752
+Î¸Ï 18656
+ψή 18584
+μώ 18574
+Ï„o 18544
+ήφ 18157
+po 18023
+Îβ 18016
+os 17994
+σώ 17901
+ιη 17737
+οη 17736
+at 17725
+ξΠ17653
+ίξ 17639
+ήδ 17572
+li 17405
+λπ 17198
+as 16867
+Îψ 16823
+em 16805
+nd 16710
+ai 16617
+Îω 16433
+et 16429
+pa 16408
+Ï_ 16298
+όβ 16008
+Ï„_ 15979
+da 15918
+Ï€_ 15720
+Ïξ 15697
+pr 15653
+ηχ 15485
+si 15351
+υφ 15343
+u_ 15341
+ss 15317
+_h 15306
+ξά 15245
+γυ 15215
+om 15144
+ce 15102
+εε 15050
+_q 14883
+ll 14761
+Î±Ï 14736
+βί 14652
+Ï€o 14591
+λτ 14561
+vα 14413
+ie 14389
+άχ 14389
+άκ 14301
+ιή 14285
+so 14275
+οή 14160
+no 14083
+όθ 13995
+to 13965
+il 13890
+κφ 13851
+Ïχ 13828
+Ïφ 13728
+θι 13622
+Ïγ 13617
+υα 13565
+Îφ 13453
+do 13347
+ha 13344
+m_ 13311
+_g 13306
+au 13297
+ζό 13290
+ήγ 13278
+οο 13172
+rt 13072
+eu 13048
+χη 13045
+ξί 12949
+ξω 12864
+ca 12860
+ir 12847
+_k 12810
+tr 12793
+ve 12768
+Îθ 12697
+vo 12619
+ec 12479
+mi 12471
+ni 12449
+ol 12418
+he 12338
+di 12264
+σβ 12195
+δω 12126
+εώ 12007
+un 11852
+ξ_ 11845
+ήλ 11780
+us 11755
+εψ 11688
+οΠ11655
+ώθ 11530
+ξή 11387
+σΠ11299
+νν 11247
+Ïo 11194
+sa 11156
+αε 11095
+φώ 11032
+va 10939
+ήπ 10841
+_u 10810
+οϊ 10793
+θό 10730
+ic 10612
+σ_ 10561
+nn 10541
+πν 10539
+θά 10475
+φτ 10220
+ac 10196
+Îε 10126
+mo 10115
+Ï†Ï 10069
+Îξ 10058
+sc 9867
+βώ 9844
+ad 9772
+ιζ 9752
+βή 9709
+ψο 9696
+ci 9670
+fr 9649
+μ_ 9563
+ώδ 9504
+vi 9477
+σδ 9292
+ui 9274
+αv 9270
+κω 9205
+ϊό 9144
+ov 9075
+lo 9023
+be 9021
+υψ 8988
+nc 8949
+c_ 8939
+_Ï 8913
+λμ 8875
+Ïξ 8846
+ut 8838
+tt 8754
+_j 8753
+y_ 8748
+ap 8657
+πυ 8553
+Ïβ 8490
+χτ 8434
+ei 8406
+εο 8387
+θ_ 8324
+βη 8311
+υδ 8289
+h_ 8271
+ωv 8241
+fi 8235
+λθ 8160
+rs 7919
+rd 7884
+_w 7852
+k_ 7750
+ba 7725
+ga 7713
+ηψ 7673
+ho 7668
+ia 7640
+op 7626
+g_ 7556
+οξ 7514
+ζα 7417
+oι 7410
+γo 7377
+θω 7376
+φη 7253
+ζώ 7161
+im 7080
+οα 7078
+Ïδ 7060
+oi 7033
+th 7019
+Î³Ï 7001
+br 6972
+ηv 6950
+bo 6885
+σά 6860
+cu 6800
+ιψ 6779
+z_ 6692
+fa 6675
+ίβ 6542
+su 6517
+λ_ 6443
+pt 6426
+ζί 6418
+μυ 6417
+ΰ_ 6407
+Î¼Ï 6260
+ed 6235
+ηπ 6230
+κδ 6185
+oÏ 6174
+rι 6160
+du 6135
+rr 6079
+υη 6072
+κκ 6040
+_ΰ 5988
+δά 5975
+νυ 5951
+Î½Ï 5900
+ul 5886
+bl 5859
+mp 5851
+ot 5828
+od 5822
+εα 5816
+εζ 5750
+βό 5744
+x_ 5737
+oc 5715
+οώ 5653
+γλ 5581
+ζι 5575
+υε 5546
+σλ 5522
+av 5503
+mm 5491
+tι 5485
+εv 5470
+fo 5458
+όη 5453
+Î_ 5440
+υι 5393
+Ï…v 5371
+rn 5361
+Ïψ 5319
+lu 5303
+υά 5291
+ήψ 5271
+gr 5252
+ωή 5240
+τμ 5234
+ct 5189
+όο 5178
+όζ 5151
+βδ 5134
+ab 5126
+ηξ 5116
+Ï„Ï„ 5086
+θί 5047
+iv 5025
+κμ 5009
+ts 5000
+je 4965
+κν 4958
+tu 4941
+vτ 4926
+ck 4878
+Ïλ 4869
+Ïκ 4855
+ωφ 4832
+ιo 4812
+ηδ 4766
+ήξ 4761
+pl 4708
+oπ 4692
+Ïη 4689
+oÏ 4676
+οω 4674
+nl 4659
+ez 4647
+κo 4619
+rm 4549
+αψ 4446
+fe 4435
+β_ 4364
+μν 4346
+oλ 4322
+υή 4246
+ιs 4230
+λo 4213
+Îv 4195
+ig 4189
+τλ 4189
+um 4179
+dι 4177
+χ_ 4175
+pp 4157
+cr 4135
+ίψ 4112
+ιv 4063
+λγ 4031
+rg 4024
+ob 4018
+hi 4016
+ωδ 4007
+μσ 4005
+αο 3961
+eπ 3950
+ev 3943
+dr 3918
+ίv 3897
+λκ 3896
+go 3867
+ÏŽv 3866
+vε 3849
+τζ 3825
+eg 3819
+bi 3765
+ψτ 3762
+oμ 3757
+ex 3548
+ιr 3515
+υό 3489
+ιe 3486
+rc 3477
+mb 3476
+υο 3455
+άψ 3438
+lt 3419
+eÏ… 3379
+f_ 3367
+ψα 3352
+μo 3314
+pi 3301
+ey 3270
+hu 3269
+ki 3242
+oo 3222
+rl 3208
+θλ 3201
+bu 3192
+Ïσ 3180
+ka 3169
+gi 3149
+σo 3148
+oe 3134
+νγ 3104
+ep 3081
+iq 3057
+oς 3056
+ja 3022
+ib 3017
+ru 2983
+vι 2979
+ls 2967
+ux 2939
+ij 2917
+ud 2914
+wa 2894
+uc 2871
+βω 2851
+ώλ 2848
+κσ 2840
+εό 2808
+sv 2783
+ωλ 2748
+ÏƒÏ 2732
+mu 2730
+ιc 2728
+hl 2718
+ιt 2705
+cc 2697
+vω 2663
+wi 2651
+if 2645
+ξυ 2615
+pu 2586
+ωχ 2551
+nh 2549
+hr 2547
+oσ 2539
+af 2526
+λβ 2501
+οό 2495
+οζ 2479
+ff 2475
+jo 2472
+b_ 2465
+ld 2453
+pι 2411
+αό 2410
+βo 2359
+og 2328
+up 2321
+ώκ 2294
+dt 2266
+_x 2257
+oί 2250
+ζΠ2227
+ώω 2221
+aη 2216
+cl 2210
+άε 2189
+eo 2159
+ii 2147
+ay 2141
+ef 2139
+uv 2120
+lm 2093
+ee 2086
+oτ 2076
+ωβ 2076
+ko 2071
+ώχ 2060
+ωί 2059
+Ïv 2049
+φo 2033
+ah 2032
+ίo 1991
+of 1990
+ÏÏ€ 1989
+ow 1971
+wo 1948
+ye 1945
+kο 1944
+aa 1935
+ae 1924
+ug 1905
+θr 1903
+αι_ 1068786
+_τη 1022870
+_κα 978659
+_το 925647
+ου_ 842705
+_Ï€Ï 772492
+ης_ 762118
+να_ 757052
+και 655999
+_να 621643
+ων_ 590506
+ην_ 572763
+_στ 572481
+ια_ 560061
+την 558134
+ει_ 530642
+με_ 526606
+το_ 519845
+ση_ 514627
+_πο 501871
+τικ 472944
+_απ 470774
+_επ 470326
+του 462337
+της 451216
+_συ 446978
+ας_ 439246
+ία_ 412094
+_με 409018
+τα_ 408539
+ις_ 383321
+Ï€Ïο 379270
+_δι 377061
+_η_ 370025
+ες_ 365721
+_αν 348954
+_γι 341828
+των 339673
+που 329892
+για 329047
+_αυ 319894
+αυτ 311414
+ική 302891
+ών_ 300114
+τη_ 286140
+επι 285138
+_τω 280050
+στη 279437
+ής_ 279388
+_εί 271239
+τι_ 259212
+ματ 258136
+ος_ 257418
+_θα 256253
+θα_ 252706
+σει 246757
+ÎÏ‚_ 244527
+δια 242857
+κή_ 242234
+ται 242166
+Ï…Ï‚_ 235995
+ον_ 235759
+είν 235341
+κατ 234741
+ους 233152
+πολ 233022
+στο 229594
+_Ï…Ï€ 228850
+οπο 228291
+ως_ 227223
+οι_ 222962
+ότι 222303
+εί_ 221496
+_δε 221375
+σε_ 220458
+σης 219714
+_ότ 215471
+από 212195
+ναι 211320
+ίνα 209634
+_ευ 208876
+τις 207465
+_πα 199970
+υμε 197505
+ουμ 196929
+συν 195310
+ουν 193811
+ετα 193506
+πό_ 193265
+υν_ 191799
+_p_ 191300
+Ï€Î±Ï 191155
+ατα 190977
+εν_ 189060
+μα_ 187815
+Ï„Ïο 187322
+_τα 187251
+_σε 186567
+ηση 183840
+Ï€ÎµÏ 183590
+Ï€ÏÏŒ 181886
+_οι 180459
+_τι 176501
+Ïοπ 175108
+ιστ 173912
+ντα 173792
+μÎν 171919
+_εν 171648
+ÎµÏ…Ï 170209
+ιο_ 169918
+τον 169712
+κά_ 169615
+απο 169143
+_πε 168630
+εÏι 168228
+ικά 166428
+εις 165564
+αν_ 164255
+δεν 163692
+Ï„ÎµÏ 161229
+ίας 160122
+πει 160063
+_Îν 158063
+_κο 156641
+συμ 153312
+πιτ 151288
+αντ 148390
+ανα 148110
+ικό 144634
+οιν 144183
+Ïα_ 143752
+τε_ 140974
+κοι 139317
+κής 138218
+υτό 137836
+Ï†Î¿Ï 137796
+ισμ 136564
+ωση 136532
+στι 136105
+ποί 135120
+ημα 134266
+Îπε 134197
+οÏ_ 132227
+τό_ 131593
+Î¹Ï„Ï 126978
+κό_ 126523
+Îνα 125567
+Ïωπ 124822
+στε 124796
+οντ 124165
+Ïισ 123499
+_μΠ123142
+_εκ 122616
+στα 121999
+οÏν 121990
+σου 120540
+τά_ 119737
+_μι 119722
+δικ 119696
+ικο 118380
+_οπ 118159
+ÏÎÏ€ 118048
+χει 116475
+ολο 116247
+σία 116035
+_Îχ 115216
+μετ 115181
+Ï…Ïω 114953
+τητ 114640
+Ïοσ 112887
+_εξ 112322
+ωπα 111915
+Ï€ÏÎ 110967
+Ï€Î¿Ï 110436
+ατο 110098
+ντι 108150
+οπή 108089
+νομ 107486
+αστ 107155
+αϊκ 106870
+ότη 106488
+λογ 105391
+_μα 105184
+παϊ 104071
+θεί 103619
+ολι 103548
+Ïν_ 103489
+ατά 103358
+_θΠ102930
+μπο 102333
+ατι 102318
+νου 102218
+μια 102197
+θεσ 100663
+ίες 99779
+ασί 99059
+ικα 99055
+_Ï„Ï 98398
+ός_ 98265
+αλλ 97958
+κών 97592
+επί 97545
+ποι 97165
+τασ 96964
+νικ 96400
+_μπ 96362
+σημ 96334
+κÎÏ‚ 96181
+εια 96004
+χου 95874
+αση 95570
+er_ 94706
+ÎµÎ´Ï 94244
+υπο 93742
+νει 93738
+_πλ 93172
+υτή 93048
+τή_ 92619
+Ïά_ 92089
+αÏα 91469
+άλλ 91272
+ίου 91266
+ήσε 91137
+ινο 90322
+ικώ 88558
+ικΠ88366
+όσο 86763
+αφο 86704
+_αλ 86219
+λιτ 86061
+_ση 85941
+ητα 85935
+Îνω 85898
+_Ï‡Ï 85393
+_Î±Ï 85343
+_σχ 84474
+_κά 84148
+εÏα 83884
+_ο_ 83540
+νο_ 83040
+τος 82971
+ταν 81628
+πισ 81562
+ιτι 81272
+ÏŽÏ‚_ 80598
+μας 80308
+καν 80159
+ουλ 79587
+οτε 79453
+τελ 79411
+ετι 78967
+μικ 78345
+Ïία 78144
+ÎºÎ¿Ï 78105
+βου 77635
+ιση 77446
+ποτ 77178
+νων 76416
+_δη 75138
+ÏÏι 74969
+γμα 74316
+οÏμ 74305
+ελε 74159
+_ÎºÏ 74152
+Ïγα 73957
+εÏγ 73780
+οÏά 73644
+Ïατ 73626
+λου 73182
+ÏÎ¿Ï 73162
+εση 72036
+Ïμε 71729
+νωσ 71569
+id_ 71410
+πή_ 71224
+Î¼ÎµÏ 71192
+Ïόε 71150
+όεδ 71132
+me_ 71124
+_id 70872
+οβο 70703
+υμβ 70665
+Î²Î¿Ï 70493
+πως 70166
+λει 69822
+ame 69642
+_na 69611
+λλο 69082
+Ïος 68966
+ότε 68918
+μία 68908
+λά_ 68616
+λα_ 68532
+spe 68264
+υνα 68118
+ker 68111
+τησ 68107
+_sp 67972
+Îχε 67224
+ake 67213
+_ÎºÏ 67145
+pea 67112
+nam 67047
+eak 66939
+Ï„Î¿Ï 66934
+εων 66720
+ομι 66617
+οÏλ 66325
+μεν 66192
+νισ 65709
+κÏÏ 65439
+Ïικ 65136
+Îχο 65009
+_κυ 64983
+Ïου 64917
+_μο 64779
+λλά 64520
+σεω 64286
+καθ 64193
+Ïλι 63915
+_όπ 63380
+λευ 63083
+ήμα 62932
+υνε 62871
+_αφ 62683
+Îνο 62628
+Ïιο 62179
+λιο 62167
+δημ 61890
+ίνε 61828
+_όλ 61229
+Ïο_ 61214
+απα 61123
+_θε 60965
+άσε 60943
+_Îκ 60464
+οÏι 60408
+_ακ 59881
+τών 59818
+εÏο 59767
+ανά 59351
+Ï„Î·Ï 59240
+κÏι 59222
+νη_ 59127
+Ïαγ 58987
+σχε 58936
+ομΠ58729
+νοβ 58713
+ϊκή 58614
+Ïιε 58467
+_γε 58275
+_ÎµÏ 58207
+σμο 58170
+τάσ 58082
+Î¿Ï…Ï 57923
+τεί 57754
+_ει 57527
+οÏο 57389
+τομ 57355
+σο_ 57323
+μεί 57310
+Î¼Î¿Ï 57074
+μου 57045
+οστ 56804
+ονο 56672
+οικ 56657
+_ÏƒÏ 56522
+λόγ 56361
+ίς_ 56263
+καλ 55950
+λη_ 55877
+χετ 55786
+_ελ 55624
+γία 55513
+δÏε 55507
+αμε 55385
+_πι 55365
+σμα 55208
+θÎσ 55055
+_Î¿Ï 54869
+Ï€Î¬Ï 54849
+τας 54700
+οÏε 54687
+_σα 54630
+Ïε_ 54626
+σω_ 54423
+Î¸Î¿Ï 54113
+ιών 54036
+τήσ 53939
+Ïεί 53777
+διά 53521
+ίο_ 53344
+φων 53190
+μβο 52677
+Î¿Î»Ï 52456
+ιδι 52416
+πίσ 52055
+_εμ 52041
+_δυ 51990
+νες 51863
+ιας 51839
+σμό 51693
+σα_ 51592
+Ï€Ïα 51573
+γÏα 51565
+μη_ 51271
+Ïτε 51203
+κον 51095
+ιε_ 50653
+ευτ 50621
+ÏÏ‚_ 50602
+οία 50587
+διε 50303
+Ïει 50215
+κει 50054
+φÎÏ 50047
+αÏά 49951
+_άλ 49742
+ότα 49729
+Ïοτ 49618
+υλί 49510
+ανο 49365
+ουσ 49228
+ξη_ 49096
+νία 49055
+οÏÏ‚ 48841
+τες 48808
+εία 48722
+μαν 48621
+υπά 48215
+Ï„ÎÏ‚ 48059
+_μί 48037
+ώσε 48037
+Ï‡ÏŽÏ 47804
+όνο 47792
+δυν 47593
+όπω 47368
+ιότ 47198
+_νο 47143
+αÏχ 47124
+ιακ 46879
+_τε 46874
+_όσ 46781
+_κ_ 46728
+_ασ 46708
+Îσε 46392
+ίτε 46347
+κθε 46314
+Ïότ 46278
+κÏα 46180
+Îκθ 46170
+εξα 46126
+_λό 46123
+νατ 45878
+ÎµÎ¹Ï 45776
+Ïες 45756
+_la 45501
+ίση 45345
+ÎºÏ…Ï 45324
+στό 45299
+ιμΠ45240
+ÏÏŽÏ€ 45233
+θηκ 45138
+Ïίζ 45099
+Ïήσ 44930
+αγμ 44728
+ημε 44533
+μασ 44518
+μφω 44388
+Ïσε 44379
+λÏ_ 44219
+γασ 44155
+εκτ 44077
+μό_ 43973
+ψη_ 43965
+_χώ 43829
+ήθε 43709
+ποσ 43642
+ίζο 43616
+μÎλ 43491
+λεί 43450
+Ï…ÏÏŽ 43373
+όλο 43337
+_μό 43332
+άτω 43313
+επε 43288
+ατε 43189
+οÏί 43130
+συγ 43034
+ήσο 43032
+Ï…Ïί 42800
+θÎμ 42654
+Ïαμ 42637
+ογι 42458
+διο 42398
+Ïη_ 42350
+μάτ 42274
+ταξ 42258
+υμφ 42211
+μόν 42152
+υση 42143
+στή 42132
+όπο 42107
+νον 42103
+βασ 42086
+είς 42062
+Îμα 42053
+ιατ 41998
+ίζε 41963
+λο_ 41635
+_αγ 41593
+τιμ 41500
+εÏί 41433
+τημ 41272
+άÏχ 41125
+αÏμ 41010
+_de 41007
+ανε 40969
+Ï„ÎµÏ 40875
+λίο 40797
+Ïησ 40706
+εσμ 40692
+μεγ 40627
+_ως 40615
+Ï…Ïγ 40372
+λον 40314
+ήτη 40292
+_ιδ 40192
+όν_ 40112
+πής 40106
+ντο 39863
+σμΠ39661
+τοι 39617
+Ïάτ 39436
+_εγ 39291
+οÏσ 39125
+οίο 38879
+Î±Î¹Ï 38820
+κÏά 38708
+Ïον 38397
+ζου 38333
+αδι 38211
+Ï„Ïα 38098
+ÏŽÏα 38070
+λικ 38063
+κόμ 38045
+ÎÏο 38026
+lan 37990
+γικ 37965
+ιες 37808
+Ï‡Ï‰Ï 37746
+εισ 37665
+ωÏί 37582
+Îα_ 37531
+ζητ 37508
+εντ 37425
+ιαφ 37389
+αφΠ37373
+Ïάσ 37327
+ζήτ 37162
+αίτ 37065
+_ομ 36979
+_γν 36950
+όμε 36924
+οδο 36889
+Ï„Î®Ï 36832
+άστ 36790
+σια 36729
+ασφ 36711
+κολ 36651
+ωνι 36610
+ητή 36508
+ευθ 36375
+κε_ 36264
+χή_ 36248
+_ισ 36243
+νός 35990
+εμπ 35935
+Î»Î·Ï 35923
+τόσ 35891
+μμα 35844
+ακό 35807
+es_ 35732
+ακο 35702
+_βο 35669
+ειτ 35663
+οί_ 35625
+ang 35496
+άδε 35487
+άθε 35469
+συζ 35290
+κασ 35266
+παν 35138
+γνω 35093
+αγω 35011
+όμα 34892
+ονό 34853
+ελα 34825
+Î¿ÎºÏ 34822
+age 34659
+ημο 34571
+νετ 34497
+ge_ 34488
+θετ 34366
+ηκε 34288
+_ή_ 34258
+πικ 34233
+Ïοβ 34230
+υστ 34186
+κεί 34153
+Ïασ 34048
+ζει 34011
+ÏƒÏ„Ï 33951
+Î½ÎµÏ 33948
+βάλ 33873
+εθν 33651
+σας 33628
+ίνο 33566
+θελ 33531
+ÎÏε 33526
+Ïετ 33476
+Ïίσ 33471
+υσι 33372
+_τό 33347
+Ïια 33270
+ειδ 33230
+όμω 33226
+ÏÏŽÏ„ 33203
+_Ï„Î 33191
+οβλ 33161
+άπο 33158
+ngu 33092
+Ïωτ 33077
+εÏη 33031
+οχή 33030
+υγκ 33007
+αÏι 32871
+Ï‡Î±Ï 32864
+πλη 32847
+ιου 32836
+gua 32834
+ψηφ 32830
+ενι 32829
+ογί 32749
+ενο 32671
+uag 32658
+ονι 32608
+ωστ 32502
+Îλε 32475
+ετά 32325
+ίων 32232
+κότ 32117
+ατί 32089
+ÎµÏ‰Ï 32059
+Îνε 32055
+άνε 32016
+άνο 31962
+Îλη 31927
+μÎσ 31882
+_εφ 31860
+Ïών 31840
+υτο 31820
+ιαδ 31795
+σαν 31787
+Î³Î¿Ï 31784
+ώπη 31757
+ατό 31720
+Ïοφ 31694
+Ïοκ 31618
+ίσε 31578
+σον 31575
+_Î´Ï 31563
+de_ 31545
+_ήθ 31500
+ινω 31449
+ναν 31341
+ωνί 31254
+_νΠ31229
+οιο 31172
+γον 31152
+στά 31098
+ναφ 31008
+θει 31003
+ομά 30966
+Ïόν 30911
+μως 30905
+γο_ 30819
+_όμ 30731
+μβά 30711
+ομο 30687
+άς_ 30627
+Îλο 30547
+νησ 30536
+σκο 30505
+δÏο 30471
+σήμ 30429
+Ï„Îλ 30349
+αιτ 30328
+_μη 30261
+ινή 30253
+ζετ 30221
+είμ 30019
+Ï…Ï„Î 30016
+ιασ 29984
+είτ 29969
+ηθε 29938
+_πω 29928
+υπό 29918
+_βα 29872
+Îση 29836
+_πά 29803
+λισ 29800
+αίν 29750
+υνο 29603
+μάδ 29567
+ιτα 29447
+ξει 29437
+σÏν 29436
+Î±Î»Ï 29418
+οτι 29394
+Ïιν 29364
+Î»Î¿Ï 29355
+επα 29284
+ιχε 29194
+άση 29165
+αμμ 29138
+_Î²Ï 29089
+γάλ 29086
+πο_ 29045
+στώ 28958
+Îτο 28932
+ευσ 28887
+τισ 28811
+ναλ 28781
+μισ 28741
+χÏη 28694
+άτη 28691
+λλα 28667
+λÏÏ„ 28648
+ολλ 28646
+Î½Î¸Ï 28627
+πτυ 28618
+_οδ 28543
+είχ 28529
+Ï„ÏÏŒ 28527
+σότ 28511
+σιο 28446
+δει 28407
+πλα 28376
+ατη 28354
+Ïακ 28347
+μελ 28328
+Îνη 28265
+σφα 28201
+ίσο 28171
+λοι 28070
+σκε 28066
+ανι 28056
+μαι 28052
+εÏε 27998
+μÎÏ 27998
+γή_ 27848
+ετε 27766
+Ï€Ïά 27757
+όγο 27754
+_Î´Ï 27621
+Ïχε 27593
+Î¸ÎµÏ 27562
+_σή 27542
+ποδ 27513
+σχΠ27431
+κτι 27283
+ιμο 27269
+εγά 27209
+λαμ 27201
+Ïιβ 27174
+_αξ 27137
+οφο 27053
+Ïμο 27024
+Î±ÎºÏ 26941
+γου 26867
+ακτ 26861
+Î¿Î³Ï 26847
+Ïων 26822
+γκε 26720
+Ïόπ 26629
+ιαί 26611
+κάν 26507
+ισχ 26504
+λλε 26449
+ÏÏŽ_ 26444
+γισ 26440
+λες 26437
+_φο 26363
+ζω_ 26348
+άλε 26335
+νότ 26320
+οθε 26308
+Ïιμ 26304
+σσό 26238
+ωτι 26221
+νή_ 26169
+ίησ 26159
+λεσ 26065
+οίη 26028
+νοι 26015
+αλι 25934
+κÏί 25901
+σιμ 25786
+ανθ 25782
+λησ 25721
+Ïάγ 25713
+λλη 25704
+_ήτ 25701
+είο 25682
+αξι 25642
+αÏο 25634
+πάν 25629
+ηÏί 25625
+μιο 25610
+θÎλ 25496
+_χω 25437
+ήτα 25418
+_γί 25379
+ήμε 25278
+οδη 25275
+νόμ 25255
+ποφ 25227
+ίδι 25225
+τοπ 25158
+ητι 25108
+γίν 25085
+Ï†ÎµÏ 25082
+υπε 25049
+οÏÏ„ 24955
+εγκ 24950
+θήκ 24932
+ιμε 24894
+γει 24874
+ισσ 24858
+_σκ 24817
+άδα 24813
+Ï€ÏÏŽ 24790
+ÏŽÏε 24784
+εφα 24783
+ντί 24752
+ενδ 24740
+φαλ 24730
+ημι 24685
+_αμ 24681
+νω_ 24663
+χεί 24663
+ομα 24636
+λαί 24631
+υξη 24612
+λος 24603
+αίσ 24584
+ώμα 24492
+αθε 24457
+ξÏ_ 24409
+λημ 24365
+Î±Î¾Ï 24363
+τατ 24352
+τήμ 24334
+ίμα 24313
+αμβ 24280
+ίζω 24272
+ζον 24271
+σή_ 24236
+_εδ 24206
+δο_ 24205
+μÎα 24203
+τόχ 24200
+_ζη 24124
+τότ 24115
+τυχ 24065
+δηγ 24052
+ιγμ 24031
+Ïωσ 23962
+λων 23928
+ÎÏω 23921
+κλη 23847
+άμε 23754
+παι 23747
+ασμ 23741
+αγο 23711
+ίσι 23674
+τής 23626
+χÏÏŒ 23621
+_κε 23606
+υτά 23500
+Ï„ÏÎ 23468
+ευχ 23465
+οια 23430
+Ïόκ 23422
+οÏÎ 23388
+δα_ 23362
+_co 23316
+_ίδ 23229
+αÏκ 23225
+ητο 23218
+ελΠ23217
+άν_ 23213
+ήÏι 23162
+υλε 23149
+πε_ 23109
+Ïντ 23097
+υνΠ23092
+κάπ 23091
+υτι 23054
+βάσ 23018
+όμη 22965
+_ψη 22963
+οσπ 22911
+δή_ 22908
+en_ 22891
+ημΠ22876
+_βά 22805
+φασ 22800
+υντ 22753
+γαλ 22734
+μοκ 22723
+ωμΠ22711
+πη_ 22707
+Î½Ï‰Ï 22680
+_χα 22665
+Î³ÎºÏ 22616
+λών 22605
+λή_ 22580
+Î½Î¿Ï 22577
+ταλ 22545
+βλη 22524
+τευ 22511
+άλο 22509
+_λε 22476
+_ÎÏ„ 22425
+ενό 22405
+όκε 22396
+χÏε 22376
+ποκ 22347
+ενε 22343
+τία 22341
+θεω 22291
+ασι 22283
+υνθ 22202
+ϊκό 22201
+σικ 22181
+γαν 22160
+δη_ 22140
+Ï†Î±Ï 22137
+ιάσ 22122
+γεν 22121
+ίως 22088
+Ïιθ 21995
+υνά 21989
+υμπ 21884
+νια 21843
+Ïγί 21842
+Ïχο 21828
+εξε 21809
+ομί 21733
+όντ 21707
+εδο 21700
+οÏγ 21695
+γωγ 21655
+τόν 21637
+ίτη 21622
+Ïαφ 21613
+Ïοε 21583
+νση 21573
+υζή 21573
+Ïεσ 21550
+χαν 21539
+Ï„Ïι 21517
+βάν 21492
+_ολ 21489
+πίτ 21448
+Ïίο 21390
+άντ 21317
+θυμ 21301
+ανό 21285
+νεί 21256
+γεί 21242
+μον 21225
+ίστ 21211
+_λο 21099
+οϋπ 21094
+Ïοϋ 21066
+μπε 21022
+ÎÏγ 21017
+Îντ 20971
+γÏά 20968
+θÏω 20959
+ενη 20946
+Ïομ 20894
+πιο 20891
+νοτ 20887
+εκπ 20884
+μβα 20880
+μεσ 20868
+_να_ 611981
+_και 606117
+και_ 597709
+την_ 556790
+της_ 451189
+_της 440649
+_την 408032
+_του 402948
+_το_ 373322
+_Ï€Ïο 363842
+των_ 339489
+_για 323360
+για_ 314448
+_αυτ 302873
+που_ 300930
+του_ 297352
+_επι 281487
+_που 278319
+_των 275467
+_θα_ 250882
+ται_ 234853
+ους_ 233119
+_με_ 227892
+σης_ 219694
+_στη 215257
+ότι_ 213435
+_κατ 208439
+_από 208127
+τις_ 207459
+είνα 205787
+ναι_ 205623
+ίναι 203788
+_είν 203366
+ική_ 198075
+_ότι 197656
+υμε_ 194081
+_συν 192249
+ουμε 192078
+ουν_ 191330
+_δια 182474
+από_ 180311
+_στο 176886
+_πολ 173488
+_Ï€ÏÏŒ 171639
+_σε_ 167662
+εις_ 165555
+ικά_ 163861
+_Ï€Î±Ï 163639
+_δεν 162877
+δεν_ 162856
+_τα_ 161481
+_τη_ 161221
+ίας_ 160097
+Ï„Ïοπ 159975
+τική 159233
+_ÎµÏ…Ï 154831
+_απο 154078
+_συμ 152665
+_τις 150897
+_Ï€ÎµÏ 149413
+στην 148735
+επιτ 147889
+τον_ 147177
+κής_ 138204
+κοιν 137366
+_οι_ 137306
+σεις 136566
+αυτό 136547
+ηση_ 135833
+οποί 133292
+_κοι 132595
+τους 130304
+Îπει 129039
+Ï€Î¹Ï„Ï 126516
+πεÏι 122302
+πει_ 121797
+ÏÎπε 115580
+υτό_ 114501
+_ανα 113399
+στο_ 112884
+_οπο 112473
+ευÏω 111826
+Ï€Ïοσ 111739
+Ï…Ïωπ 111531
+Ïωπα 111342
+Ï€ÏÎÏ€ 110643
+εται 110226
+_Ï€ÏÎ 109837
+ιτÏο 107838
+Ïοπή 106717
+σει_ 105267
+τικά 103951
+ωπαϊ 103855
+παϊκ 103715
+ικής 103642
+οÏν_ 103400
+_τον 102041
+ικό_ 100715
+ίες_ 99768
+θεί_ 98463
+κών_ 97193
+_μια 96887
+_επί 96804
+Î¼Ï€Î¿Ï 96227
+κÎÏ‚_ 96175
+ότητ 95925
+ατα_ 94271
+κατά 93663
+Îνα_ 92971
+_Îνα 92750
+ωση_ 91963
+οντα 91760
+αντι 90717
+κατα 90663
+ματα 88686
+αυτή 88578
+ικÎÏ‚ 87819
+_μπο 86465
+_υπο 86452
+ικών 85579
+_σημ 85424
+_αντ 85305
+ίου_ 85286
+πολι 84234
+ολιτ 84088
+μια_ 83637
+τητα 83583
+χει_ 83320
+τικό 83295
+τος_ 82950
+νται 82338
+ασία 81089
+μας_ 80302
+_μας 80176
+_μετ 79594
+ατικ 79194
+οινο 78862
+παÏα 78164
+ετικ 77932
+δικα 77459
+Î±Ï†Î¿Ï 74866
+αση_ 74389
+σουμ 73398
+ήσει 73124
+λιτι 72785
+νει_ 72621
+ολογ 72505
+ματο 72368
+ματι 72333
+Ï€Ïόε 71140
+Ïόεδ 71129
+ÏŒÎµÎ´Ï 71121
+οÏμε 70870
+συμβ 70650
+_id_ 70640
+πως_ 70162
+ιτικ 69954
+_στι 69153
+Ïος_ 68966
+οπή_ 68901
+σία_ 68764
+βουλ 68534
+ker_ 67818
+_spe 67331
+ame_ 67249
+υτή_ 67222
+name 66987
+aker 66963
+_nam 66944
+spea 66934
+peak 66933
+eake 66930
+μετα 66721
+εων_ 66439
+_αλλ 66324
+νωση 65390
+στη_ 64809
+βοÏλ 64739
+_κÏÏ 64006
+κÏÏι 63346
+εÏα_ 62226
+_δικ 62136
+Îχει 61547
+οÏλι 61067
+λιο_ 60810
+_καθ 60749
+ητα_ 60703
+μÎνο 60526
+οÏά_ 60289
+μία_ 59781
+σεων 59552
+Ïμε_ 59310
+συνε 59305
+Ïλιο 59075
+σημα 59040
+πιστ 59009
+Îχου 58974
+λλά_ 58728
+γματ 58513
+ντικ 58236
+ινοβ 58149
+αϊκή 58104
+νοβο 58099
+στικ 58062
+Ïία_ 58060
+νομι 57729
+_δημ 57668
+ατά_ 57632
+αποτ 57322
+στις 56541
+εση_ 56466
+_απα 55992
+θεση 55822
+ποτε 55489
+ταση 55465
+χουν 55190
+φοÏά 55073
+εια_ 54798
+τας_ 54698
+τηση 54500
+εδÏε 54349
+_σχε 54191
+ÏŒÏ„ÎµÏ 54159
+αλλά 54053
+_Îχο 53893
+κοÏ_ 53597
+τών_ 53308
+_στα 53244
+στε_ 52883
+_Îχε 52667
+εÏγα 52567
+όσο_ 52420
+νες_ 51863
+ιας_ 51836
+ημα_ 51272
+ατος 51137
+ταν_ 51127
+ÏÏιε 50980
+ομικ 50976
+Ï€Î¿Î»Ï 50794
+Ïιε_ 50579
+μου_ 50339
+Îνωσ 50244
+ήματ 50236
+δÏε_ 50081
+_Îνω 49737
+ποία 49502
+υμβο 49369
+_άλλ 49043
+ονομ 48929
+Î¹ÎºÎ¿Ï 48861
+οÏÏ‚_ 48839
+τες_ 48806
+_ανά 48725
+Ï„ÎÏ‚_ 48055
+ησης 47969
+οικο 47790
+οία_ 47614
+τελε 47541
+_διε 47441
+ουλί 47264
+τικΠ47229
+άσει 46893
+_υπά 46752
+οποι 46743
+_αφο 46453
+_μία 46393
+οÏÎ¿Ï 46368
+στα_ 46296
+νων_ 46270
+κθεσ 46232
+Ïοπο 46224
+σχετ 46220
+_Îκθ 46169
+Îκθε 46165
+τεÏο 45996
+όπως 45970
+_όπω 45909
+Ïες_ 45752
+_λόγ 45721
+Ï…Ï€Î¬Ï 45719
+οτελ 45173
+_διά 45034
+ÏƒÎ¼Î¿Ï 44978
+ωσης 44555
+_μου 44389
+σίας 44258
+χετι 44061
+ιών_ 44053
+κÏατ 44017
+_Ï‡ÏŽÏ 43806
+ολÏ_ 43727
+Ïγασ 43725
+μφων 43706
+πολο 43701
+στον 42962
+ήσου 42846
+παÏά 42561
+λογι 42441
+_ÎºÏ…Ï 42329
+συμφ 42202
+_οικ 42116
+είς_ 42059
+θοÏν 41749
+_καλ 41584
+αγμα 41439
+_νομ 41431
+_Ï„Ïο 41299
+Ïαγμ 41107
+θÎμα 41017
+ισμο 40862
+τικώ 40796
+_συγ 40788
+ισμό 40770
+Ï€Ïαγ 40748
+Ïισμ 40712
+τεÏα 40640
+_ως_ 40614
+_μεγ 40608
+επίσ 40605
+ιμÎν 40578
+_θÎμ 40409
+_μÎλ 40334
+ιση_ 40242
+_όσο 40167
+λίου 40143
+πής_ 40102
+ουÏγ 39937
+ÏÏ„ÎµÏ 39765
+στασ 39754
+πίση 39739
+πάÏχ 39736
+_Ï€Ïα 39419
+οÏισ 39414
+ποÏο 39365
+ίσης 39314
+σμÎν 39295
+μοÏ_ 39011
+ίνει 39009
+υλίο 38877
+οπής 38837
+_καν 38727
+Ï€Ïοτ 38668
+ευÏÏŽ 38303
+ποίο 38275
+μάτω 37988
+ιες_ 37807
+ώσει 37739
+_αÏχ 37733
+γασί 37486
+_εξα 37387
+διαφ 37383
+μαντ 37344
+_μόν 37255
+ζήτη 37138
+κυÏί 37108
+άλλο 37008
+άτων 36982
+οÏεί 36947
+κÏάτ 36828
+ημαν 36783
+σουν 36776
+αστε 36604
+ιστε 36490
+ικον 36442
+ιστι 36273
+νός_ 35988
+_εÏγ 35837
+κονο 35722
+Î¿Î²Î¿Ï 35574
+λλον 35357
+σμό_ 35352
+Ïεί_ 35350
+όμεν 35325
+ποÏε 35293
+μÎνω 35274
+_συζ 35184
+νου_ 34815
+αμε_ 34669
+_δυν 34657
+όνο_ 34570
+γία_ 34507
+_lan 34325
+ÏƒÏ„Î·Ï 34184
+ηκε_ 34109
+δυνα 34087
+Ïιστ 34080
+νισμ 34075
+Îνου 33996
+lang 33980
+σματ 33972
+ζει_ 33943
+τόσο 33911
+εÏο_ 33892
+Ï€Ïος 33864
+μόνο 33778
+Ï€Ïοβ 33679
+ÏŽÏα_ 33668
+σας_ 33627
+age_ 33379
+_κÏά 33252
+Îσει 33241
+_θÎσ 33177
+νική 32736
+λογί 32729
+angu 32712
+ngua 32690
+guag 32658
+uage 32658
+οβου 32573
+_εμπ 32530
+ικασ 32521
+εÏικ 32374
+_τομ 32227
+υμφω 32177
+εία_ 32087
+νία_ 32072
+ϊκή_ 31959
+ίων_ 31889
+νεÏγ 31496
+_ήθε 31423
+ήθελ 31423
+ικαι 31409
+ισμΠ31390
+ικότ 31199
+συγκ 31039
+τημα 30997
+ινων 30925
+μως_ 30901
+τεί_ 30845
+Ï…ÏÏŽÏ€ 30754
+Ïώπη 30746
+θελα 30559
+δημο 30405
+αδικ 30352
+οινω 30304
+_σας 30233
+λευτ 30176
+ελα_ 30138
+αναφ 30071
+όμως 30033
+_όμω 29961
+σον_ 29895
+διαδ 29678
+ιστο 29649
+σημε 29563
+τικο 29560
+_υπό 29455
+Ï€Ïότ 29221
+όσον 29159
+Î¼Î²Î¿Ï 29148
+νετα 29148
+_μÎσ 29132
+_ακό 29127
+Ï…Ï„ÎÏ‚ 29043
+μαστ 29010
+αυτο 28915
+μενο 28754
+πεÏί 28730
+ομάδ 28544
+Ïαμμ 28542
+Ïοβλ 28378
+ακόμ 28308
+γÏαμ 28277
+ηθεί 28270
+ομÎν 28242
+υνατ 28235
+ντας 28214
+τεÏη 28189
+υση_ 28168
+νουν 28132
+_de_ 28099
+τήσε 28024
+_επε 27991
+αφÎÏ 27971
+μÎνη 27936
+ίζου 27802
+λόγο 27681
+_ιδι 27616
+εÏη_ 27593
+μαι_ 27302
+εÏισ 27266
+ίσου 27244
+εγάλ 27161
+Îμα_ 27105
+_πισ 27098
+_σήμ 27083
+_επα 26920
+Îση_ 26900
+μεγά 26896
+_αν_ 26702
+ζετα 26688
+ποστ 26678
+_χÏη 26648
+ϊκής 26644
+θηκε 26626
+θÎσε 26621
+σαν_ 26460
+λες_ 26435
+_Ï€Ïά 26258
+Ïων_ 26253
+Îλη_ 26232
+Ï„Ïόπ 26138
+διατ 26102
+τομΠ26094
+μική 26070
+ποίη 26024
+μÎνε 25957
+_εισ 25920
+οίησ 25863
+Ï€Ïοκ 25851
+ήτησ 25766
+_οÏι 25765
+πολλ 25609
+Ï‡ÎµÎ¹Ï 25605
+_θÎλ 25488
+ευση 25483
+_σχΠ25463
+ιότη 25445
+_ήτα 25362
+ίσει 25324
+ωνία 25301
+οπολ 25265
+_Ï‡Ï‰Ï 25245
+αÏμο 25238
+Ïική 25237
+_πλη 25191
+ητας 25190
+άτη_ 25151
+χουμ 25151
+ήταν 25116
+_πλα 25097
+Î®Î¼ÎµÏ 25049
+Ïότα 25048
+Ïάτη 25016
+_γίν 24998
+_Ï„ÏÏŒ 24856
+Ïόπο 24812
+τηÏί 24782
+_Ï€ÏÏŽ 24751
+ωτικ 24718
+Î¿Ï†Î¿Ï 24639
+μεÏα 24635
+Ïών_ 24630
+εÏιο 24610
+λος_ 24603
+ÏŽÏες 24603
+σήμε 24580
+_κάν 24576
+_υπε 24523
+ηματ 24521
+ιαδι 24517
+ÏοÏν 24491
+εταξ 24393
+Ï„Î±Î¾Ï 24362
+αξÏ_ 24361
+μÎλη 24355
+αποφ 24290
+οτικ 24253
+υποσ 24245
+ότασ 24229
+ειας 24193
+στεί 24154
+αναλ 24121
+ίζω_ 24074
+_ομά 24066
+_τελ 24055
+οίο_ 24000
+Ïισσ 23983
+ομÎα 23934
+ητικ 23897
+οδηγ 23892
+ισσό 23823
+σότε 23769
+σσότ 23763
+χώÏε 23750
+λαμβ 23707
+τής_ 23621
+ίζει 23611
+τάσε 23607
+_οδη 23565
+κανο 23561
+νουμ 23480
+ζοντ 23431
+_ανθ 23399
+μεÏι 23397
+Ïιο_ 23325
+αλÏÏ„ 23293
+Î±Î½Î¸Ï 23254
+υτά_ 23214
+χÏόν 23209
+λÏτε 23207
+ειτα 23204
+ελευ 23158
+οχή_ 23147
+κολο 23111
+Î±Î³Î¿Ï 23097
+τήÏι 23046
+_Ï†Î¿Ï 23045
+συνΠ23019
+_κάπ 22972
+αυτά 22937
+παÏο 22937
+τήμα 22936
+νατό 22887
+_ψηφ 22775
+οκÏα 22732
+Ï€ÏÏŽÏ„ 22721
+νοντ 22695
+_ασφ 22658
+κειτ 22658
+άστα 22648
+_γνω 22599
+_όλο 22564
+ÏοÏσ 22561
+κότη 22535
+Ï€Î»Î·Ï 22487
+ίηση 22467
+ποιο 22423
+_είχ 22350
+επισ 22331
+ουλε 22319
+Ï€Ïόκ 22314
+ÏƒÏ„ÎµÏ 22254
+ÏιμΠ22217
+Îνη_ 22213
+ιδια 22194
+αίνε 22182
+κτικ 22168
+_ίδι 22161
+βάλλ 22161
+μÎνα 22125
+Î¼Î¿ÎºÏ 22088
+ίως_ 22086
+Ïχει 22076
+άÏχε 22068
+φαÏμ 22056
+_ζητ 22055
+μÎα_ 22051
+φÎÏο 22047
+Î¸ÎµÏ‰Ï 22044
+μάδα 22040
+όκει 22032
+κασί 22028
+λεί_ 21964
+άση_ 21908
+αϊκό 21891
+ετε_ 21876
+νωνι 21859
+ωμÎν 21745
+_ποι 21690
+_εγκ 21676
+ιται 21672
+Ïια_ 21657
+Îνων 21652
+άνει 21627
+Ïήσε 21622
+συζή 21568
+υζήτ 21568
+υτικ 21562
+_εν_ 21559
+αίσι 21556
+ϊκό_ 21550
+ντα_ 21530
+νωÏί 21515
+αυτΠ21513
+_χÏÏŒ 21464
+αγωγ 21463
+λαίσ 21388
+πλαί 21387
+Î³Î½Ï‰Ï 21384
+όταν 21370
+Ï€Ïοε 21351
+ÏοÏμ 21329
+συμπ 21327
+αντα 21308
+Ïγία 21298
+_στό 21287
+αντί 21286
+στου 21256
+_μελ 21236
+ταστ 21210
+σμα_ 21191
+ασης 21136
+υγκε 21119
+Ïοϋπ 21061
+Ï€Ïοϋ 21058
+Îνες 21052
+ληση 20917
+_εφα 20912
+_αξι 20895
+ατασ 20891
+ÎµÏ†Î±Ï 20881
+σφαλ 20858
+_εκτ 20848
+_εντ 20833
+ελεί 20817
+ίνου 20811
+ωνικ 20804
+Î·Î¼ÎµÏ 20739
+νης_ 20732
+γίας 20725
+Ïηση 20713
+επικ 20671
+εδÏο 20593
+_θεω 20587
+Ïσει 20570
+άλει 20562
+αποκ 20539
+ώστε 20508
+μβάν 20497
+_σÏν 20489
+Ïόκε 20489
+ωστό 20487
+δημι 20481
+αστι 20458
+Ï…Ïία 20453
+_γεγ 20399
+μβου 20392
+αμβά 20377
+λων_ 20373
+γÏαφ 20359
+ονισ 20349
+_εδώ 20343
+ατάσ 20328
+μιου 20327
+λοντ 20314
+_ώστ 20313
+εδώ_ 20280
+ημιο 20251
+_εκπ 20247
+Î¯Ï„ÎµÏ 20245
+τάστ 20243
+αναγ 20237
+γεγο 20183
+γονό 20180
+εγον 20180
+επίτ 20155
+ογικ 20141
+μματ 20129
+ουσι 20090
+κάπο 20051
+τός_ 19999
+_αγο 19996
+φωνί 19993
+νας_ 19985
+στόχ 19982
+Ïγαν 19970
+καν_ 19955
+ώπη_ 19954
+Ï„Î¿Ï…Ï 19944
+ζητή 19934
+ασφα 19906
+οÏία 19895
+συνθ 19766
+_τόσ 19751
+Ïοστ 19725
+πτυξ 19684
+Ïίζο 19647
+_πως 19645
+διαί 19629
+ιστώ 19559
+Î¹Î¿Ï…Ï 19517
+Ï…Ï„Î¿Ï 19496
+Ïοσπ 19491
+_ενδ 19450
+Ï€Ïόσ 19443
+είμα 19422
+_είμ 19403
+ÏÎÏ‚_ 19392
+ζουμ 19350
+ιότι 19326
+εκÏι 19325
+εσμα 19323
+ψηφί 19279
+εάν_ 19277
+αίτε 19261
+ογισ 19258
+κÏιμ 19233
+ÎºÎµÎºÏ 19225
+ιαίτ 19190
+μός_ 19172
+Ï„ÏŽÏα 19160
+_Ï„ÏŽÏ 19144
+Ïους 19142
+γκεκ 19128
+όπο_ 19115
+οÏσα 19104
+κόμη 19102
+όμη_ 19100
+Ïώτη 19091
+φÎÏε 19085
+επιχ 19030
+συμμ 19022
+μÎÏ„Ï 19014
+αποδ 19003
+Ï…Î½ÎµÏ 18987
+διαπ 18970
+αταν 18958
+_εάν 18948
+αÏακ 18923
+τεÏι 18914
+ωÏίζ 18885
+διο_ 18862
+_όχι 18855
+ίνετ 18854
+όχι_ 18854
+οϋπο 18831
+άλλη 18804
+άποι 18789
+σιο_ 18778
+ενο_ 18753
+_εθν 18733
+Ïίζε 18721
+_μÎÏ„ 18706
+είο_ 18705
+Ï‰Ï„ÎµÏ 18702
+_κÏα 18701
+διακ 18697
+λημα 18667
+οια_ 18666
+_οÏγ 18650
+άνου 18635
+Î¹ÏƒÏ‡Ï 18621
+τοÏν 18574
+πιχε 18569
+ειες 18526
+όλα_ 18521
+ογία 18500
+_Ï€Ïω 18469
+γική 18453
+_γεν 18433
+χÎÏ‚_ 18428
+_εκε 18375
+γίνε 18322
+Îναν 18285
+εκεί 18277
+μετά 18230
+δÏο_ 18228
+_δÏο 18223
+ζουν 18220
+άγμα 18218
+ευτι 18216
+λεσμ 18202
+Ïοτε 18168
+πιο_ 18155
+λους 18134
+_πιο 18079
+ημεί 18067
+ηκαν 18059
+ανάπ 18036
+τόχο 17995
+_μÎÏ 17975
+υλευ 17967
+διότ 17954
+νάπτ 17942
+ημοκ 17910
+είτα 17863
+ίται 17862
+θÎση 17859
+άπτυ 17851
+τόν_ 17836
+_ευχ 17834
+συνά 17794
+συντ 17791
+ίζετ 17774
+Ïωση 17764
+φοÏί 17755
+γισμ 17746
+τως_ 17684
+όπου 17680
+στημ 17667
+Ïατι 17666
+άÏχο 17637
+σφάλ 17611
+ÎÏει 17568
+ινοτ 17525
+_ελε 17484
+_σÏμ 17474
+θώς_ 17468
+μιας 17465
+τυξη 17462
+_ενό 17444
+_πλε 17437
+νομί 17430
+Ïντα 17425
+σχÎσ 17418
+_ήδη 17409
+ήδη_ 17408
+δÏος 17399
+_δηλ 17384
+_εξε 17362
+ναν_ 17356
+τωση 17320
+υνθή 17310
+νθήκ 17308
+υνση 17297
+ενός 17282
+θεια 17278
+εθνι 17254
+ξης_ 17252
+Ï€Î¯Ï„Ï 17250
+θνικ 17245
+λον_ 17243
+_σαφ 17224
+οÏντ 17213
+αίτη 17208
+Ïάγμ 17203
+_όλα 17186
+βλημ 17186
+λόγω 17184
+Ï€Ïάγ 17155
+_ότα 17128
+αϊκο 17123
+πηÏε 17120
+ÎÏου 17114
+Ïχου 17113
+τοÏ_ 17109
+_κάτ 17104
+εÏίπ 17096
+τώσε 17069
+αλλα 17054
+ονός 17033
+εÏω_ 17011
+ÏŠÎºÎ¿Ï 16997
+στÏα 16959
+ίτÏο 16958
+γοÏά 16958
+Ïημα 16942
+δÏάσ 16929
+ξει_ 16872
+ήσω_ 16832
+αθώς 16812
+ίσιο 16810
+ÏÏιο 16804
+Ïίου 16796
+καθώ 16791
+νίας 16781
+φοÏο 16773
+τοπο 16765
+λεια 16746
+ναφΠ16741
+ακολ 16727
+τιμε 16726
+ίωση 16698
+ασφά 16683
+ινή_ 16606
+Îλος 16603
+αÏισ 16599
+συνα 16596
+τεÏω 16593
+_ÏƒÏ„Ï 16571
+ειÏή 16539
+Ïετι 16522
+λών_ 16499
+συνο 16499
+_ανε 16466
+είας 16449
+όγω_ 16448
+Ïιση 16412
+Ï…Ï€Î·Ï 16375
+υμμε 16339
+ειμΠ16324
+Ïου_ 16317
+ιχει 16308
+οίες 16303
+ατών 16299
+ποίε 16287
+σμός 16278
+ικαν 16261
+θεσμ 16259
+οστα 16227
+ντιμ 16212
+νση_ 16186
+ανία 16184
+μείς 16159
+δια_ 16152
+ητες 16147
+_ενι 16143
+δηγί 16142
+_κάθ 16139
+Ïακτ 16066
+σαμε 16021
+_ωστ 16011
+λου_ 16010
+κειμ 16005
+ανάγ 16003
+Ïοσω 15999
+στόσ 15998
+_βάσ 15995
+ποιη 15980
+_ισχ 15978
+Î·Î¸Î¿Ï 15963
+εÏιβ 15940
+ισης 15937
+ώματ 15933
+_δÏά 15905
+κάθε 15896
+νότη 15882
+ÏƒÏ„Î¿Ï 15855
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/en.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/en.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/en.ngp (working copy)
@@ -1,1002 +1,3060 @@
-# NgramProfile generated at Sat Sep 25 16:10:16 EEST 2004 for Nutch Language Identification
-ngram_count 17519106
-_ 1191232
-e 750875
-t 591495
-i 484399
-o 482445
-a 454758
-n 443928
-s 384634
-r 367994
-h 279978
-e_ 262998
-l 229295
-c 204888
-d 190948
-th 177869
-u 175776
-m 171216
-s_ 157019
-p 145498
-t_ 130275
-he 129701
-f 128785
-n_ 126618
-the 117027
-in 109499
-on 101096
-re 99127
-w 98681
-g 97789
-d_ 97220
-he_ 94659
-an 87954
-y 87169
-b 82185
-er 78625
-en 77104
-at 77075
-is 72841
-ti 72076
-y_ 70739
-r_ 65364
-es 65010
-v 63690
-o_ 62140
-nt 61985
-it 59668
-or 57185
-nd 56414
-io 56402
-to 53540
-co 53425
-al 53284
-te 53227
-ion 52220
-ar 51939
-f_ 51006
-ha 49899
-of 47847
-st 47446
-me 47431
-ou 46146
-l_ 45981
-ve 43526
-ro 41546
-nd_ 41006
-on_ 40449
-ed 40273
-se 39604
-ng 38467
-and 38294
-hi 37368
-ion_ 37119
-ent 36998
-ic 36655
-as 36581
-ur 35514
-de 35460
-ea 35223
-le 34427
-tio 34216
-si 34154
-ed_ 34109
-tion 33999
-g_ 32689
-ing 32587
-pr 32161
-be 32113
-ng_ 31999
-li 31655
-om 31454
-es_ 31238
-ing_ 30361
-h_ 29773
-ri 29541
-k 29431
-ta 29276
-re_ 29090
-pe 28576
-nt_ 28050
-ra 27758
-ce 27738
-ec 27709
-po 27154
-ns 26911
-er_ 26375
-ne 26318
-ll 26118
-at_ 24919
-fo 24918
-op 24539
-un 23982
-we 23709
-ch 23628
-hat 23622
-men 23540
-ss 23459
-hat_ 23402
-al_ 23384
-ati 23242
-no 22970
-tha 22799
-for 22603
-ct 22310
-us 22150
-nc 22088
-ent_ 21767
-rt 21539
-em 21341
-wh 20975
-el 20938
-ot 20782
-that 20617
-ac 20592
-ly 20418
-mi 20283
-ma 20261
-il 20210
-thi 20188
-ul 19951
-ly_ 19930
-ca 19894
-ment 19537
-la 19355
-com 19295
-ee 19163
-tr 19073
-wi 19030
-di 18968
-ve_ 18877
-ci 18829
-ho 18610
-ia 18567
-so 18445
-ni 18401
-ut 18263
-am 18054
-res 17961
-ts 17760
-atio 17547
-pro 17415
-is_ 17369
-con 17228
-ie 16927
-ts_ 16822
-na 16476
-his 16273
-ate 16217
-et 16100
-or_ 15988
-an_ 15869
-rs 15588
-su 15421
-se_ 15266
-are 15244
-this 15211
-his_ 15203
-her 15085
-m_ 15080
-id 15048
-mm 15046
-ons 15030
-ll_ 14957
-en_ 14954
-ol 14912
-ch_ 14888
-pa 14622
-st_ 14481
-ge 14388
-ad 13891
-os 13764
-le_ 13509
-iv 13488
-ns_ 13375
-im 13357
-ere 13326
-ter 13267
-pl 13212
-fi 13194
-mo 13189
-ld 13136
-rop 13064
-ir 12807
-ope 12799
-comm 12656
-omm 12656
-ai 12496
-ev 12456
-av 12318
-eu 12246
-lo 12214
-mp 12111
-all 12093
-ld_ 11997
-sio 11812
-sion 11812
-ke 11681
-vi 11602
-ce_ 11562
-ect 11498
-ab 11442
-ty 11419
-bl 11400
-ow 11389
-wo 11279
-ther 11238
-not 11209
-ith 11198
-sa 11107
-ort 11098
-ty_ 11038
-ver 11001
-ssi 10977
-x 10964
-tu 10953
-iti 10944
-ive 10937
-sh 10929
-rea 10912
-whi 10843
-th_ 10808
-eur 10744
-gr 10738
-nce 10725
-te_ 10720
-pre 10537
-eve 10507
-hic 10420
-ich 10309
-sta 10309
-ot_ 10304
-wa 10254
-ich_ 10171
-hich 10106
-whic 10104
-our 10103
-ag 10100
-wit 10005
-ig 9958
-with 9880
-ave 9807
-oul 9789
-sp 9756
-ide 9748
-ry 9731
-int 9709
-par 9700
-ap 9693
-as_ 9690
-uld 9685
-uro 9676
-ould 9675
-euro 9665
-uld_ 9654
-rope 9649
-ut_ 9587
-ons_ 9567
-cti 9559
-por 9497
-eg 9481
-rs_ 9464
-ex 9411
-cou 9388
-mmi 9375
-urop 9313
-w_ 9311
-hav 9263
-ions 9183
-ef 9137
-port 9127
-ave_ 9049
-iss 9045
-ame 9025
-ill 8964
-oc 8838
-ry_ 8820
-do 8809
-ess 8804
-gh 8793
-have 8775
-ep 8753
-ted 8694
-ommi 8686
-rd 8650
-fe 8605
-pea 8584
-ean 8515
-ted_ 8511
-ies 8405
-if 8389
-ies_ 8367
-oun 8351
-ov 8336
-here 8221
-me_ 8212
-k_ 8197
-ssio 8174
-pp 8089
-ay 8080
-ue 7986
-mis 7976
-ity 7914
-ity_ 7914
-mu 7902
-ith_ 7893
-ble 7852
-ers 7829
-cu 7809
-j 7743
-nte 7713
-ust 7684
-rat 7577
-da 7573
-uc 7561
-est 7548
-ill_ 7497
-pres 7480
-bu 7471
-ean_ 7425
-ere_ 7417
-uni 7396
-ls 7383
-tiv 7327
-rn 7279
-tic 7229
-fr 7220
-ica 7134
-ak 7103
-q 7093
-gi 7067
-miss 7041
-issi 7001
-tin 6991
-ive_ 6980
-one 6980
-qu 6928
-ur_ 6898
-pean 6897
-opea 6892
-rm 6892
-rl 6784
-pos 6778
-tive 6777
-a_ 6773
-by 6753
-rt_ 6737
-od 6727
-wil 6705
-nce_ 6686
-ga 6683
-hou 6661
-will 6658
-ate_ 6647
-ure 6638
-ba 6631
-sti 6618
-ff 6607
-mmis 6607
-fa 6601
-ore 6597
-der 6593
-tat 6556
-str 6545
-up 6528
-tt 6482
-cr 6470
-eme 6456
-sid 6429
-coun 6425
-cl 6420
-mb 6368
-ial 6367
-ant 6363
-art 6357
-act 6339
-um 6327
-ain 6300
-nti 6292
-ei 6285
-den 6275
-nal 6262
-c_ 6230
-ple 6230
-igh 6205
-amen 6201
-ay_ 6192
-ese 6152
-side 6151
-mr 6127
-end 6114
-ke_ 6109
-oo 6098
-ble_ 6095
-du 6072
-ua 6033
-has 6030
-fu 5977
-ntr 5939
-ct_ 5919
-ome 5870
-ht 5842
-ear 5841
-bo 5806
-ght 5795
-ern 5788
-ove 5784
-ne_ 5780
-go 5716
-tra 5697
-ting 5695
-abl 5680
-enc 5664
-ic_ 5621
-ber 5605
-p_ 5605
-lu 5598
-lit 5586
-lat 5534
-ore_ 5532
-ib 5493
-und 5468
-per 5467
-een 5464
-out 5459
-nci 5453
-als 5433
-ers_ 5421
-au 5400
-ces 5395
-eas 5387
-yo 5364
-ust_ 5339
-emen 5308
-een_ 5303
-hin 5303
-man 5292
-iden 5284
-nts 5283
-nts_ 5283
-imp 5274
-arl 5241
-cal 5214
-ss_ 5143
-tur 5131
-ste 5129
-u_ 5128
-can 5125
-ake 5124
-esi 5120
-iam 5119
-but 5113
-ight 5096
-ar_ 5093
-af 5084
-her_ 5083
-rec 5079
-spe 5048
-rep 5047
-ru 5047
-ecti 5040
-lic 5023
-rk 5023
-sho 5008
-use 5004
-inte 4993
-oli 4937
-era 4936
-ew 4934
-ow_ 4926
-in_ 4908
-ob 4907
-tan 4864
-ist 4857
-pol 4854
-nat 4840
-inc 4835
-sed 4832
-mbe 4812
-sed_ 4804
-rom 4798
-lt 4797
-mber 4780
-cia 4772
-nit 4767
-ort_ 4764
-app 4761
-nde 4759
-rg 4756
-stat 4743
-you 4729
-dent 4708
-anc 4690
-ren 4688
-eco 4686
-ds 4641
-wou 4636
-lly 4634
-tri 4632
-lly_ 4631
-ial_ 4629
-woul 4622
-mpl 4613
-tte 4602
-wor 4597
-ctio 4568
-nal_ 4566
-et_ 4561
-unt 4559
-om_ 4552
-reg 4543
-rit 4518
-ds_ 4489
-tate 4487
-eed 4484
-ter_ 4484
-lia 4474
-ure_ 4465
-resi 4460
-ten 4439
-min 4432
-ess_ 4403
-sc 4399
-esid 4378
-ina 4373
-ona 4373
-poli 4357
-bi 4356
-gu 4346
-eat 4343
-oi 4338
-nta 4327
-able 4326
-tes 4319
-part 4308
-rr 4301
-og 4296
-emb 4271
-han 4254
-cial 4246
-ont 4243
-enti 4236
-gre 4229
-nio 4224
-vo 4206
-cc 4191
-ous 4187
-oth 4183
-ose 4181
-thin 4174
-nion 4173
-ind 4172
-ount 4159
-cy 4155
-ven 4150
-din 4137
-ral 4136
-lea 4119
-tl 4116
-lso 4103
-ents 4100
-ge_ 4089
-ally 4080
-ine 4075
-ard 4074
-ee_ 4065
-ast 4064
-ey 4055
-ki 4055
-ref 4053
-rin 4041
-ens 4040
-tho 4026
-ise 4003
-shou 3997
-nter 3993
-houl 3987
-ug 3980
-ish 3976
-ms 3969
-so_ 3968
-va 3960
-cons 3948
-ner 3946
-lso_ 3938
-rati 3938
-also 3936
-over 3936
-tes_ 3933
-nsi 3924
-onal 3923
-pec 3921
-nst 3914
-mus 3913
-de_ 3912
-ber_ 3889
-rli 3888
-iona 3885
-must 3876
-embe 3873
-rou 3860
-nv 3855
-ues 3842
-hes 3840
-ant_ 3838
-ctiv 3838
-pt 3833
-ins 3826
-rie 3826
-il_ 3821
-fro 3813
-ree 3811
-cy_ 3803
-rig 3799
-dis 3789
-fic 3780
-age 3778
-mit 3774
-sin 3770
-mor 3767
-ula 3757
-sen 3756
-rta 3747
-ey_ 3732
-vel 3729
-eri 3722
-arli 3721
-tal 3721
-pe_ 3720
-pu 3710
-ical 3701
-ire 3682
-ny 3679
-lati 3678
-ran 3674
-rom_ 3672
-ini 3671
-its 3670
-eci 3669
-gra 3651
-mem 3650
-nf 3648
-from 3634
-ding 3630
-uti 3616
-memb 3609
-ever 3608
-whe 3608
-parl 3598
-ence 3597
-sit 3595
-iame 3594
-liam 3593
-rlia 3593
-onc 3591
-ud 3590
-lar 3577
-ub 3576
-spec 3575
-us_ 3569
-prop 3566
-ui 3558
-reat 3547
-cont 3545
-ou_ 3522
-omp 3519
-lis 3515
-ates 3505
-ote 3504
-ple_ 3492
-ew_ 3486
-rti 3481
-ppo 3480
-comp 3475
-ery 3458
-der_ 3454
-ese_ 3454
-unio 3448
-ali 3446
-itio 3422
-ely 3417
-kin 3415
-pi 3412
-ely_ 3407
-ome_ 3400
-ye 3393
-bee 3390
-oin 3386
-any 3384
-ase 3382
-righ 3372
-tor 3357
-very 3353
-red 3350
-pri 3348
-cul 3338
-nati 3331
-cer 3328
-ite 3315
-ade 3308
-ake_ 3306
-ili 3303
-ope_ 3302
-gen 3300
-tak 3295
-ver_ 3295
-unc 3294
-fin 3290
-orm 3287
-ene 3285
-been 3281
-utio 3281
-ance 3272
-nl 3260
-rc 3256
-lem 3253
-ans 3238
-hen 3238
-iw 3233
-ord 3229
-em_ 3227
-ms_ 3220
-ik 3204
-mon 3202
-cal_ 3192
-sur 3184
-ves 3172
-ny_ 3163
-ime 3160
-egi 3156
-enta 3152
-esp 3143
-ral_ 3141
-was 3139
-ue_ 3137
-conc 3115
-cha 3114
-use_ 3103
-efo 3099
-ori 3099
-nn 3096
-efor 3088
-thes 3082
-now 3079
-fer 3078
-evel 3076
-more 3066
-ect_ 3057
-hese 3057
-ead 3045
-acc 3036
-ip 3027
-isi 3025
-aus 3017
-nk 3017
-ice 3016
-ndi 3016
-cil 2995
-othe 2987
-fore 2978
-tim 2975
-out_ 2973
-que 2972
-ned 2967
-ned_ 2964
-les 2956
-form 2955
-untr 2951
-tai 2948
-ult 2943
-wha 2939
-lin 2931
-unit 2931
-tie 2929
-what 2929
-ery_ 2921
-ary 2920
-aw 2918
-mat 2911
-arti 2910
-opo 2909
-ary_ 2907
-pla 2900
-ppor 2899
-ys 2898
-eed_ 2894
-econ 2885
-ffe 2883
-cess 2879
-king 2877
-ht_ 2872
-agr 2871
-ike 2868
-ght_ 2835
-ties 2831
-lik 2827
-like 2825
-ck 2819
-eal 2819
-how 2818
-rov 2817
-take 2815
-ser 2811
-tre 2807
-nis 2805
-ork 2804
-tw 2803
-ual 2802
-ir_ 2799
-inst 2796
-ega 2792
-lity 2791
-nm 2788
-rd_ 2787
-epo 2779
-work 2778
-ain_ 2777
-lan 2774
-my 2773
-ries 2770
-ncil 2762
-oci 2751
-xt 2751
-id_ 2750
-ju 2750
-ounc 2750
-nu 2749
-mpo 2746
-itu 2741
-epor 2740
-repo 2738
-olic 2734
-pen 2732
-ari 2731
-ropo 2731
-who 2731
-prov 2719
-sse 2718
-ls_ 2715
-soc 2707
-ike_ 2704
-soci 2693
-bou 2685
-fac 2685
-ach 2682
-ici 2682
-nme 2682
-nmen 2682
-acti 2681
-ext 2680
-duc 2678
-abo 2674
-ture 2674
-sec 2671
-cle 2667
-hen_ 2667
-nin 2666
-once 2662
-ring 2653
-eo 2646
-hey 2646
-hey_ 2646
-they 2646
-ous_ 2631
-sent 2627
-tly 2625
-tly_ 2621
-tit 2616
-ntri 2609
-eq 2606
-equ 2605
-xp 2602
-ost 2600
-unci 2600
-nee 2592
-iat 2590
-nder 2590
-ning 2586
-ert 2581
-icu 2573
-cat 2570
-icul 2559
-ris 2552
-exp 2551
-cil_ 2548
-sol 2548
-rese 2546
-ear_ 2538
-uct 2535
-need 2534
-hu 2529
-tain 2527
-impo 2526
-opos 2526
-reas 2523
-sure 2523
-rel 2522
-itt 2519
-je 2519
-nly 2512
-nly_ 2511
-uch 2510
-ces_ 2509
-tal_ 2506
-tia 2505
-sib 2499
-ugh 2491
-mple 2487
-omi 2485
-ose_ 2485
-bli 2483
-tab 2478
-ves_ 2477
-esti 2475
-mme 2473
-mmit 2468
-cau 2465
-rge 2462
-ssu 2441
-rtic 2436
-bec 2435
-att 2433
-ause 2430
-ong 2428
-asi 2427
-eir 2426
-uch_ 2421
-sm 2419
-dr 2415
-ace 2414
-nge 2411
-oug 2411
-hei 2410
-ilit 2405
-ough 2403
-rst 2399
-onsi 2397
-tem 2397
-ani 2394
-ifi 2392
-erat 2390
-cre 2386
-mak 2381
-resp 2379
-thei 2378
-heir 2373
-ced 2371
-refo 2371
-ura 2369
-bil 2367
-eir_ 2367
-ded 2363
-hing 2361
-am_ 2360
-tee 2360
-owe 2357
-jec 2354
-ject 2354
-sl 2349
-eli 2346
-elo 2344
-ric 2342
-isa 2335
-mar 2335
-ated 2334
-wer 2331
-z 2330
-mea 2326
-leg 2323
-ond 2321
-gro 2314
-stan 2314
-unde 2314
-time 2311
-caus 2307
-eth 2305
-spo 2304
-ded_ 2296
-sel 2295
-oint 2289
-sup 2288
-ress 2287
+# NgramProfile generated at Tue May 31 01:27:43 CEST 2005 for Nutch Language Identification
+e 16313901
+t 12608684
+i 10236561
+o 10196532
+a 9988042
+n 9553662
+s 8238494
+r 8001086
+h 5928665
+l 4941592
+c 4291655
+d 4188061
+u 3778251
+m 3737893
+p 3487911
+f 2705094
+g 2198405
+w 2049293
+y 1844328
+b 1783387
+v 1344111
+k 732968
+x 228897
+j 165117
+q 142477
+z 77699
+é 6925
+ö 6020
+á 3076
+à2549
+ü 2015
+ä 1925
+ó 1867
+è 1094
+à798
+æ 658
+ç 523
+ê 477
+ò 446
+ñ 380
+ú 285
+ã 242
+ô 240
+ø 239
+ï 223
+ß 206
+Ã¥ 203
+ë 90
+ì 64
+û 64
+º 42
+â 35
+î 10
+ù 10
+ý 5
+õ 4
+µ 3
+ð 1
+þ 1
+e_ 5714114
+_t 4717493
+th 3810883
+s_ 3402711
+_a 2999367
+t_ 2845361
+he 2774431
+n_ 2678216
+_i 2427447
+in 2302078
+d_ 2145230
+on 2137733
+re 2121043
+an 1885461
+_o 1834655
+er 1748820
+en 1651422
+at 1638806
+_p 1569420
+_s 1554735
+_w 1537040
+y_ 1505482
+ti 1504721
+r_ 1489820
+_c 1489552
+is 1439283
+es 1395763
+o_ 1322499
+nt 1312727
+or 1250480
+it 1227876
+nd 1185283
+io 1155249
+to 1134590
+co 1121939
+te 1112531
+ha 1111119
+al 1100860
+me 1098371
+ar 1062212
+_b 1060111
+f_ 1058277
+_m 1047310
+of 994423
+l_ 980546
+st 975327
+_f 969639
+ou 961102
+ve 915696
+ro 890401
+ng 877960
+_e 870992
+ed 858791
+ea 841403
+se 829204
+_r 829012
+de 785985
+si 749956
+ur 747982
+le 741636
+ic 733663
+as 728244
+hi 724809
+_h 721298
+_d 711162
+g_ 700677
+pr 700605
+be 691907
+pe 682789
+_n 675483
+om 663429
+li 659479
+h_ 625308
+ri 610636
+ta 605150
+ra 603123
+a_ 595343
+po 592844
+ce 589811
+ec 576319
+ns 570265
+ll 566527
+ne 554887
+fo 524917
+op 508600
+un 502896
+we 494590
+_l 490869
+ss 488623
+no 485137
+rt 478073
+us 470714
+nc 467082
+la 465707
+em 464218
+ch 461839
+ct 458014
+el 447467
+ot 438493
+ma 435615
+na 435425
+il 435273
+am 432212
+ly 431927
+ul 429485
+ca 427259
+mi 425188
+ee 425020
+id 424194
+wh 410140
+tr 409051
+wi 405152
+ho 404096
+ni 399531
+di 398175
+ut 390980
+p_ 381745
+so 376744
+ac 376529
+ci 372747
+ts 368390
+ge 361110
+ie 360699
+et 357320
+_u 345520
+ia 342954
+ke 340989
+rs 339113
+_g 336128
+su 335482
+m_ 324148
+i_ 323967
+pa 321709
+mm 311097
+ol 305981
+os 292839
+im 289961
+fi 285683
+mo 283314
+sp 281496
+ad 280732
+ai 278467
+pl 274446
+ld 270810
+ir 269927
+iv 266715
+ev 265877
+mp 264277
+lo 259556
+ag 257202
+eu 256953
+av 252271
+ow 248635
+bl 245864
+sh 242878
+vi 242161
+wo 241965
+gr 241250
+ak 239410
+sa 238543
+tu 230944
+ty 225516
+ab 218787
+ry 217196
+wa 209078
+_v 200319
+w_ 199876
+ep 197361
+ig 197356
+ex 196223
+eg 192166
+ef 188070
+do 187710
+k_ 186661
+pp 184946
+rd 179947
+cu 176001
+gh 173242
+ay 173159
+fe 173027
+ov 172496
+uc 172049
+ap 171762
+bu 169552
+oc 168409
+ua 168009
+if 165530
+ue 164370
+mu 164308
+fr 162306
+ls 158097
+da 154792
+_y 152870
+rm 152458
+tt 150133
+by 149014
+rl 148259
+ga 148094
+od 145908
+gi 145175
+rn 144992
+ba 144704
+du 141963
+cr 141247
+ff 141077
+up 138589
+qu 137460
+mr 137304
+fa 136838
+cl 136678
+c_ 136107
+oo 135761
+gu 135477
+ei 135450
+mb 134516
+bo 126992
+um 124246
+fu 124159
+go 119109
+rk 117375
+lt 113765
+ru 112932
+lu 112928
+u_ 109482
+au 108465
+ht 107314
+yo 106532
+ob 105976
+ib 104956
+rg 102008
+ew 101119
+ds 100168
+rr 98271
+oi 95498
+cy 92580
+cc 92017
+pt 91806
+tl 90904
+og 88536
+ey 87894
+va 87845
+ki 86646
+vo 86562
+_j 85232
+ms 85037
+ug 84093
+ud 83452
+sc 83067
+bi 81256
+pu 81035
+af 80488
+ub 80115
+nl 77256
+ui 77077
+ny 75198
+_k 75041
+nf 75017
+nv 74147
+ye 73180
+nn 72304
+_q 71520
+rc 70348
+pi 70013
+nk 68488
+nu 64365
+ik 63805
+ck 63105
+tw 62498
+xt 59265
+ys 59205
+eo 58437
+my 58301
+ip 56534
+xp 55576
+dr 55523
+ju 54493
+eq 53407
+br 52998
+je 51385
+gn 50496
+nm 49963
+sm 49186
+sl 48574
+dm 48248
+hu 47311
+iz 46752
+hr 46078
+rv 45653
+aw 45190
+ft 44757
+jo 44370
+bs 43613
+lf 41596
+wn 41518
+ze 41152
+eb 40108
+sk 40003
+lv 38515
+oa 37082
+sy 36639
+fl 36512
+dg 36471
+dy 36435
+ks 34424
+ps 33917
+ph 33886
+oe 33855
+gl 33132
+gs 32999
+kn 32396
+oy 32081
+bj 31577
+dl 30567
+dd 30301
+eh 28678
+xa 28255
+hy 27672
+pm 27441
+ok 26926
+ym 25988
+xi 25096
+yi 24185
+gy 23643
+rp 23576
+xc 23510
+tm 22866
+lr 20242
+hn 19803
+ek 17901
+x_ 17722
+ws 17517
+rw 16716
+sw 16597
+aj 16407
+xe 15525
+ka 15326
+b_ 14687
+dv 14671
+lc 14617
+lp 14514
+lk 14364
+ax 14180
+uf 14029
+sf 13559
+gg 12948
+hl 12839
+tc 12319
+bt 12144
+oh 11987
+za 11518
+rb 10980
+oj 10938
+rh 10813
+tn 10379
+fy 10372
+lw 10340
+yp 10273
+ko 10051
+wt 9988
+kl 9865
+rf 9626
+lm 9587
+ae 9243
+cs 9219
+gt 9201
+yt 9192
+hs 9117
+iu 8546
+z_ 8381
+ja 8291
+nh 7794
+wr 7642
+ej 7160
+ix 7142
+wl 6979
+hm 6702
+uo 6675
+v_ 6557
+lg 6535
+ez 6327
+sb 6325
+sr 6244
+yl 6074
+bv 5941
+ah 5843
+zi 5413
+_z 5362
+py 5163
+zo 5109
+ox 5029
+bm 4973
+ya 4964
+mn 4810
+az 4744
+nj 4606
+yn 4567
+ij 4453
+gm 4434
+aq 4375
+aa 4311
+ii 4219
+sd 4151
+lb 4146
+gd 4020
+sv 3773
+ml 3669
+uk 3666
+sn 3384
+yr 3375
+nr 3337
+dt 3334
+fs 3311
+q_ 3235
+ux 3141
+cq 3074
+hd 3028
+ky 2998
+dj 2899
+bb 2875
+nb 2748
+tf 2729
+yc 2710
+np 2703
+ao 2651
+dw 2648
+tz 2601
+nz 2581
+nw 2527
+yb 2509
+kr 2508
+nq 2486
+iq 2455
+dn 2414
+mc 2369
+hb 2330
+kh 2314
+ln 2268
+cp 2187
+mf 2176
+yu 2156
+é_ 2150
+hc 2122
+fg 2068
+uy 2055
+sq 2028
+tp 2010
+xu 1917
+tb 1817
+df 1790
+ku 1782
+zz 1765
+_x 1742
+yw 1706
+dh 1649
+uz 1649
+vy 1592
+rö 1569
+ál 1553
+dp 1522
+cn 1489
+oz 1443
+kg 1408
+wy 1402
+cf 1398
+dc 1394
+ón 1365
+gc 1364
+cb 1361
+mé 1351
+rz 1351
+lz 1342
+hw 1329
+ji 1326
+sg 1249
+db 1228
+ör 1195
+j_ 1191
+ró 1133
+ös 1120
+vu 1116
+án 1114
+ÃÂn 1046
+pd 1042
+xh 1011
+öm 1005
+zá 994
+än 987
+yd 975
+uv 937
+ré 920
+cd 906
+jö 904
+pf 894
+bö 890
+ér 889
+kf 871
+wu 864
+cz 859
+rü 854
+ih 851
+én 850
+qi 849
+vr 833
+tv 806
+zu 798
+km 790
+js 771
+sj 761
+ÃÂa 760
+üb 749
+bw 735
+dq 731
+nx 723
+qv 716
+à_ 712
+dz 707
+lh 705
+bd 692
+gf 691
+és 679
+lé 674
+pb 667
+jk 659
+rà657
+kw 649
+wf 647
+jt 640
+kt 621
+kp 600
+_á 592
+uq 581
+pé 580
+bc 575
+zq 575
+tà571
+èr 569
+iè 548
+wm 540
+bh 525
+cm 511
+öd 509
+uh 507
+fp 501
+pä 501
+_à497
+yg 493
+bn 492
+cà488
+uu 474
+kd 457
+üh 456
+ná 452
+iw 449
+xo 446
+vc 445
+ön 445
+hö 442
+éd 439
+hé 432
+hf 430
+ué 424
+hq 420
+wp 420
+hh 414
+pc 408
+æk 408
+bæ 407
+wd 405
+ié 404
+sá 404
+vs 404
+tg 401
+td 397
+gp 387
+ça 383
+mü 381
+ül 381
+êt 375
+hä 374
+rq 374
+vé 369
+zn 369
+bé 364
+rè 360
+dü 355
+jn 355
+sö 349
+dà340
+pg 331
+kj 329
+kk 327
+ès 322
+bk 320
+uw 319
+öl 316
+él 313
+dé 308
+iö 306
+sé 305
+zl 304
+ó_ 302
+kx 293
+ÃÂ_ 291
+mt 290
+té 287
+_ö 285
+sò 284
+är 284
+òl 284
+pk 278
+má 277
+tê 277
+gb 276
+ét 274
+ég 270
+pv 269
+fä 268
+dö 264
+pw 260
+gö 257
+öh 255
+lq 250
+äm 248
+ög 242
+zs 240
+kä 239
+ão 239
+wb 236
+zh 236
+ÃÂe 233
+ær 230
+jæ 229
+zb 229
+_é 228
+só 227
+lö 220
+mv 218
+sà216
+hp 215
+lä 214
+yh 210
+öw 210
+öö 210
+dk 205
+xx 205
+mg 203
+ør 202
+fc 201
+añ 196
+ún 190
+fm 189
+zy 187
+éo 187
+cú 183
+oq 182
+bp 178
+év 178
+mh 177
+ün 173
+_ê 171
+kv 171
+qa 171
+kb 169
+yk 168
+ém 163
+pö 161
+fn 160
+gü 160
+hk 160
+jø 157
+uj 155
+ß_ 155
+ò_ 155
+cò 152
+öt 150
+aï 149
+ló 148
+ño 148
+aß 146
+yz 145
+öc 143
+ôt 142
+cj 140
+cô 139
+hj 139
+wk 137
+zf 137
+óp 137
+md 136
+rç 136
+á_ 130
+ñe 130
+wc 129
+aç 126
+xy 126
+_Ã¥ 125
+fw 121
+tx 115
+vl 111
+ár 110
+iy 108
+yy 105
+jd 101
+nä 101
+tà100
+iñ 99
+äf 98
+éc 98
+iã 97
+ür 94
+fé 93
+hg 92
+vä 92
+xv 92
+öç 90
+là89
+ée 89
+éa 88
+äy 87
+üs 86
+nö 83
+nç 82
+gv 81
+tá 81
+tk 80
+äl 79
+ña 79
+ö_ 78
+cg 76
+pj 76
+tj 76
+mw 75
+zr 75
+né 74
+Ã¥u 74
+hü 73
+pn 73
+rà73
+ió 72
+rx 72
+éb 72
+sä 71
+nè 70
+oë 70
+ä_ 69
+às 68
+çi 68
+èd 68
+ïv 68
+vd 67
+_ç 62
+là62
+oû 62
+xf 62
+ût 62
+rã 61
+_ó 60
+ïr 60
+yf 59
+ës 58
+ï_ 58
+jr 57
+lj 55
+ço 54
+mã 53
+rj 53
+ÃÂg 52
+_ì 50
+mà49
+oñ 49
+gé 48
+tó 48
+zó 48
+éu 47
+fb 46
+Ã¥_ 46
+cw 45
+gk 45
+lá 45
+rá 45
+lü 44
+fd 43
+xl 43
+_à42
+aà42
+vn 42
+êo 42
+ái 41
+kö 40
+uà40
+yá 40
+ÃÂo 39
+eå 38
+vg 38
+ép 38
+fh 37
+mè 36
+vp 36
+vv 36
+zc 36
+_ô 35
+fv 35
+jm 35
+_º 33
+bf 33
+mó 33
+èn 33
+zk 32
+ác 32
+éi 32
+ÃÂá 32
+º_ 31
+ìa 31
+gw 30
+áô 30
+éj 30
+qm 29
+ôï 29
+öv 29
+eß 28
+jü 28
+Ã¥r 28
+êa 28
+jp 27
+mk 27
+ßl 27
+èg 27
+ÃÂs 27
+üt 27
+mö 25
+wü 25
+èc 25
+fk 24
+fó 24
+nà24
+sø 24
+tü 24
+ww 24
+cv 23
+kc 23
+rú 23
+uß 23
+øl 23
+_â 22
+_ø 22
+sz 22
+ßb 22
+ás 22
+cé 21
+ÃÂt 21
+mø 20
+â_ 20
+Ã¥s 20
+hô 19
+jh 19
+jú 19
+vá 19
+yv 19
+ôn 19
+úc 19
+có 18
+eï 18
+så 18
+sü 18
+äi 18
+ôs 18
+úa 18
+üd 18
+bg 17
+sã 17
+zw 17
+äc 17
+ël 17
+ÃÂc 17
+ñi 17
+fá 16
+lè 16
+sú 16
+xn 16
+ór 16
+bá 15
+mä 15
+zm 15
+oï 14
+uç 14
+vt 14
+úi 14
+dó 13
+gj 13
+iú 13
+uñ 13
+vè 13
+zv 13
+ús 13
+üc 13
+bä 12
+cá 12
+gó 12
+iá 12
+vb 12
+xw 12
+äu 12
+èv 12
+_ü 11
+eñ 11
+fj 11
+fü 11
+jv 11
+mà11
+sè 11
+và11
+äs 11
+éf 11
+ìg 11
+hz 10
+kü 10
+qs 10
+rô 10
+zt 10
+ôr 10
+öp 10
+ú_ 10
+bü 9
+há 9
+jà9
+rä 9
+rê 9
+vk 9
+zp 9
+zü 9
+èl 9
+éé 9
+êr 9
+ïs 9
+ói 9
+_æ 8
+dä 8
+eó 8
+gè 8
+lx 8
+vm 8
+yx 8
+zg 8
+ºc 8
+áb 8
+ád 8
+át 8
+Ã¥l 8
+çu 8
+è_ 8
+èm 8
+ól 8
+ôh 8
+_è 7
+aë 7
+aú 7
+eá 7
+hè 7
+wé 7
+xs 7
+zé 7
+Ã¥c 7
+ót 7
+ôl 7
+øn 7
+aé 6
+bè 6
+fà6
+gx 6
+jc 6
+jy 6
+jz 6
+pz 6
+rò 6
+xm 6
+ám 6
+âc 6
+ät 6
+èt 6
+ì_ 6
+ìï 6
+ÃÂl 6
+ós 6
+ùn 6
+úl 6
+_ß 5
+bq 5
+dá 5
+gø 5
+hà5
+iç 5
+jä 5
+nú 5
+oã 5
+pó 5
+uê 5
+vf 5
+vh 5
+vx 5
+wä 5
+_th 3308033
+the 2500345
+he_ 2049706
+on_ 1110972
+ion 1072173
+_in 999892
+_to 984818
+_of 981009
+of_ 947855
+_co 940372
+to_ 926575
+_an 896078
+nd_ 856005
+and 808836
+ent 788514
+is_ 785540
+ed_ 724023
+in_ 719014
+tio 713638
+ing 698512
+ng_ 683777
+es_ 665530
+at_ 663009
+er_ 644423
+_re 613810
+re_ 608589
+nt_ 606695
+_pr 576857
+_be 556639
+hat 534802
+tha 521473
+men 492508
+_is 488965
+ati 488373
+al_ 480144
+for 475794
+_a_ 453642
+ly_ 421696
+an_ 420896
+_fo 407970
+res 404733
+as_ 404682
+_wh 403828
+or_ 403461
+com 403424
+ve_ 402410
+_ha 398317
+_we 391612
+thi 390589
+_on 381405
+_wi 378852
+pro 371441
+con 362446
+ts_ 348584
+_it 332369
+en_ 329574
+_no 328160
+ate 325132
+her 322185
+ll_ 321146
+se_ 318270
+ons 314261
+his 311278
+we_ 306968
+st_ 303961
+_de 302593
+it_ 295868
+_i_ 292698
+ch_ 291524
+le_ 285981
+me_ 282332
+_ma 280765
+ns_ 280153
+are 280005
+ere 274694
+ame 273242
+ter 272392
+rop 270350
+_ar 267122
+pea 266884
+ope 266068
+ort 263215
+omm 263080
+_p_ 260960
+_al 259177
+all 258813
+_as 256101
+_st 250981
+be_ 249758
+ld_ 245728
+ce_ 245014
+pre 241118
+sio 238284
+th_ 237102
+not 234464
+_po 232711
+ect 231600
+_eu 231391
+_pa 231178
+ver 230992
+rea 230401
+ssi 228862
+ide 225289
+nce 224603
+eve 224226
+por 223300
+eur 222627
+ty_ 218792
+ith 217622
+iti 216214
+ive 216141
+ot_ 215287
+_me 214622
+te_ 213848
+sta 212385
+wit 210966
+rs_ 209047
+par 206638
+ut_ 205813
+_ca 205238
+ave 204910
+cou 203416
+our 203015
+_se 202757
+oul 201652
+int 200929
+hav 200700
+uld 199991
+whi 199841
+_wo 199609
+uro 198049
+ry_ 197624
+ake 197234
+mmi 196064
+ill 195788
+cti 194732
+_un 193413
+_so 192865
+hic 192737
+ich 191841
+ess 188016
+spe 187711
+_su 186250
+ted 186013
+oun 183394
+iss 178352
+ies 177693
+ean 174591
+_di 173502
+ers 170986
+ble 170157
+_mo 168817
+rt_ 164718
+est 162687
+_sp 162465
+_ne 160602
+sid 159605
+rat 159460
+mis 158911
+den 158035
+ity 157489
+_la 157208
+id_ 154212
+ust 154131
+_ex 153690
+nte 153563
+tic 151794
+tin 151583
+uni 151026
+_wa 150480
+_fr 150299
+_fi 148847
+one 148608
+by_ 146832
+hou 146457
+ure 146241
+pos 145435
+_sh 144934
+_by 144254
+_bu 143185
+ur_ 142935
+_ac 141903
+eme 141881
+wil 141569
+_na 140981
+tiv 140973
+sti 140530
+ore 139744
+ain 138809
+so_ 138363
+_en 137609
+_li 137348
+has 137102
+_mr 137078
+nal 134880
+ica 134795
+tat 133208
+_ou 132956
+esi 132342
+_do 132209
+ant 131368
+ay_ 130410
+end 130401
+tra 130395
+nti 129602
+der 129501
+ear 128705
+ke_ 128388
+act 128027
+str 127888
+ntr 127716
+_at 127197
+ge_ 126550
+_le 126428
+art 125869
+ne_ 124561
+enc 124426
+ber 124191
+ple 123396
+_tr 123245
+ome 123062
+ic_ 121647
+age 121633
+ove 121611
+eas 119350
+een 119345
+_sa 119209
+ese 119114
+ial 119050
+ces 118987
+out 118513
+_im 117694
+als 117397
+_ho 117104
+ct_ 117046
+_ag 117005
+nts 116145
+abl 116114
+ern 116060
+rep 115539
+imp 115523
+mr_ 114902
+per 114625
+us_ 114493
+lit 114222
+_ta 114215
+_pe 114008
+igh 113718
+_fa 112841
+arl 112688
+nci 112310
+_he 111894
+can 111853
+_mu 110810
+use 110789
+hin 110315
+cal 110273
+ss_ 110187
+lat 109933
+ow_ 109714
+sho 108996
+ar_ 108581
+_id 108096
+wor 107914
+de_ 107695
+eak 107668
+tur 107311
+_or 106956
+but 106874
+app 106350
+gre 105993
+tte 105975
+lic 105658
+rec 105526
+_si 105368
+ght 105219
+tan 105126
+man 105085
+mbe 105010
+und 104896
+lan 104782
+et_ 104516
+ker 103808
+ist 103454
+_am 102832
+rom 102798
+era 102672
+nat 102046
+oli 101969
+ste 99962
+_gr 99386
+nam 99102
+nde 98755
+om_ 98623
+eco 98412
+lly 98051
+nit 97677
+pol 97348
+unt 97337
+mpl 96945
+anc 96712
+ee_ 96197
+inc 96121
+ds_ 95914
+tes 95507
+lia 94891
+tri 94713
+ren 94572
+sed 93963
+han 93629
+_yo 93174
+oth 92696
+ree 92659
+tho 92634
+you 92568
+wou 92486
+ona 92425
+emb 92363
+ont 92237
+rit 92137
+ina 91589
+min 91341
+eat 90581
+ang 90145
+_fu 90132
+eed 89807
+ose 89649
+cia 88933
+ind 88216
+ven 88122
+ten 87995
+_s_ 87604
+cy_ 87358
+il_ 87220
+lea 87171
+rie 87043
+din 86681
+rli 86591
+lso 86552
+ral 86332
+reg 85145
+_ab 84459
+nio 84155
+rin 84075
+fro 83961
+ard 83937
+ous 83732
+ine 83405
+ens 83159
+fic 82672
+nst 82667
+_us 82636
+ins 82316
+ppo 82264
+mit 82003
+eri 81805
+nta 81609
+_ba 81468
+_te 81452
+mus 81267
+ner 80603
+ref 80541
+mor 80498
+ran 80137
+_go 80111
+ey_ 79943
+rou 79940
+nsi 79520
+iam 79200
+lar 78932
+ini 78784
+_ad 78487
+_ch 78325
+pe_ 78069
+ula 77715
+eci 77712
+rta 77592
+sin 77239
+sen 77117
+_mi 77050
+mem 76919
+ery 76862
+pec 76607
+bee 76513
+its 76400
+gen 76019
+omp 75713
+unc 75595
+sit 75495
+dis 75443
+_ap 75343
+ise 75246
+tor 75224
+rti 75090
+ans 75005
+lem 74832
+oin 74808
+red 74374
+hes 73913
+_ri 73848
+whe 73799
+onc 73635
+mon 73401
+kin 73205
+ish 73047
+cul 72966
+vel 72963
+ire 72867
+uti 72773
+tak 72519
+ime 71958
+gra 71379
+_qu 71303
+ote 71290
+ues 71266
+ely 71264
+sur 70789
+ou_ 70549
+ew_ 70383
+epo 70338
+pri 70194
+ult 70148
+any 69948
+ms_ 69435
+em_ 69237
+ork 69098
+hen 69017
+cil 68843
+acc 68839
+fin 68806
+now 68793
+ast 68517
+ite 68180
+_ra 67817
+_cr 67670
+cer 67562
+tim 67441
+ene 67248
+_ve 67079
+ice 67015
+was 66598
+eal 66455
+gua 66305
+ase 66278
+_ev 66195
+orm 66163
+ndi 65973
+ord 65949
+ili 65931
+tal 65886
+duc 65834
+lin 65821
+opo 65794
+ny_ 65648
+_cl 65643
+ori 65517
+ue_ 65499
+ary 65419
+ali 64924
+agr 64648
+fer 64315
+esp 63783
+isi 63695
+_ge 63438
+itt 62847
+_op 62842
+rig 62769
+pla 62686
+up_ 62587
+_lo 62467
+efo 62335
+les 62245
+mat 61912
+ht_ 61791
+how 61778
+ves 61569
+ir_ 61559
+ead 61547
+ls_ 60963
+_pu 60812
+tai 60535
+ned 60511
+mpo 60400
+rov 59935
+egi 59775
+sec 59632
+ike 59481
+wha 59361
+cha 59333
+nin 59309
+do_ 59193
+que 59100
+itu 59094
+who 59013
+ffe 58884
+lis 58878
+tie 58831
+icu 58528
+_pl 58446
+_vi 58404
+ani 58353
+lik 58308
+rd_ 58161
+uct 58099
+ext 58093
+ser 58046
+pen 57650
+aus 57610
+abo 57465
+ega 57461
+cat 57445
+sse 57439
+nis 57331
+ade 56697
+bou 56527
+iat 56321
+ong 56311
+hey 56208
+tre 56077
+_ye 56052
+_if 55957
+if_ 55926
+ici 55819
+ari 55595
+ris 55492
+am_ 55355
+ugh 55338
+cle 55335
+tit 55122
+ual 54994
+ert 54958
+no_ 54932
+tee 54847
+tly 54691
+exp 54561
+ad_ 54434
+sib 54303
+_ti 54203
+uch 54202
+my_ 54151
+rel 54046
+ngu 54044
+_hi 53903
+_ot 53841
+cre 53630
+eir 53557
+equ 53387
+mar 53257
+nly 53148
+nge 53014
+oug 52971
+owe 52907
+omi 52806
+att 52783
+bli 52399
+ach 52300
+cau 52232
+bec 52231
+tia 52214
+mea 52153
+wer 52024
+nee 51958
+ond 51810
+hei 51747
+_bo 51644
+eli 51514
+uag 51454
+ric 51289
+mme 51121
+get 51114
+tar 51112
+sol 51104
+ell 51098
+sup 50861
+spo 50838
+ura 50708
+ses 50667
+sal 50528
+rge 50344
+dec 50337
+som 50282
+ded 50008
+rst 49793
+tab 49722
+ced 49438
+lle 49399
+_my 49244
+leg 49142
+_ju 49014
+fac 48966
+lie 48925
+ost 48722
+mak 48717
+rk_ 48661
+tem 48641
+ifi 48592
+bil 48302
+gro 48258
+irs 48083
+nme 47749
+_ec 47684
+erm 47626
+nes 47580
+eth 47308
+_up 47297
+ece 47290
+nk_ 47132
+ace 47097
+jec 47001
+sel 46984
+upp 46946
+fir 46817
+way 46740
+ass 46710
+ono 46501
+cce 46431
+ssu 46308
+asi 45836
+rem 45821
+oci 45720
+elo 45540
+gh_ 45527
+roc 45350
+soc 45333
+tru 45249
+ffi 45145
+eca 45140
+nsu 45117
+war 45008
+rod 44777
+ann 44676
+ibl 44560
+rke 44560
+mer 44422
+iev 44198
+suc 44108
+sis 44104
+sh_ 44083
+el_ 44081
+_br 44053
+mad 43812
+_es 43785
+poi 43736
+ele 43699
+rio 43651
+_ce 43329
+nda 43283
+qui 43139
+osa 42963
+emp 42935
+cis 42912
+_af 42894
+dev 42812
+cur 42611
+eop 42511
+ria 42399
+icy 42356
+ron 42336
+erv 42330
+new 42198
+odu 41955
+ram 41937
+bet 41899
+oss 41898
+dem 41822
+iou 41738
+mun 41738
+aid 41611
+cie 41602
+low 41419
+tro 41396
+ntl 41291
+opl 41271
+oce 41258
+ho_ 41215
+_cu 41195
+son 41167
+peo 40983
+onl 40930
+mmu 40859
+yea 40726
+pon 40657
+rre 40539
+_fe 40452
+ogr 40444
+ita 40436
+cri 40405
+nom 40375
+see 40282
+od_ 40228
+_vo 40189
+try 40166
+_gi 40163
+ful 40154
+_em 40134
+_ob 39914
+rog 39907
+lop 39764
+led 39614
+day 39606
+des 39564
+gai 39564
+urs 39526
+hos 39334
+ia_ 39296
+edu 39169
+ivi 39124
+ein 39089
+vin 39060
+dit 38976
+hem 38920
+bel 38884
+uri 38709
+clu 38679
+rma 38666
+jus 38599
+cts 38531
+chi 38501
+obl 38495
+arg 38481
+eff 38423
+oll 38399
+tua 38386
+wn_ 38364
+har 38350
+hea 38194
+rna 38114
+llo 38090
+thr 38037
+_ru 37954
+ark 37939
+giv 37933
+own 37914
+wee 37794
+aga 37793
+_ef 37778
+rde 37711
+osi 37661
+eem 37654
+eti 37603
+_da 37321
+dir 37319
+alt 37246
+sue 37108
+ign 37069
+rac 36952
+rte 36914
+ndm 36893
+sub 36881
+ovi 36770
+adi 36702
+ved 36697
+rob 36660
+dme 36584
+rth 36573
+rly 36543
+ela 36453
+ept 36285
+med 36281
+rse 36216
+ara 36168
+wel 36168
+tel 36110
+bat 36089
+mes 36059
+ink 36048
+lf_ 35962
+cen 35954
+tec 35684
+lut 35653
+isc 35556
+_ci 35530
+etw 35419
+ume 35387
+rds 35375
+ppr 35357
+ood 35347
+_hu 35290
+olu 35285
+edi 35185
+hal 35151
+ize 35029
+dif 34983
+lon 34960
+rm_ 34909
+nto 34766
+isa 34765
+emo 34712
+ack 34702
+mic 34672
+say 34466
+inf 34439
+rce 34366
+lli 34328
+ian 34291
+dge 34100
+oti 34082
+ole 34055
+dy_ 34037
+ems 34030
+eac 33963
+ncl 33875
+ien 33711
+dea 33637
+cit 33550
+vot 33496
+lve 33353
+fun 33332
+ks_ 33269
+nds 33220
+nfo 33136
+vid 33128
+dam 33093
+iff 33045
+_ro 32976
+lac 32905
+_va 32801
+oup 32723
+_sc 32711
+ncy 32698
+bas 32656
+twe 32600
+cas 32589
+_ai 32556
+uat 32337
+_el 32254
+air 32232
+_dr 31994
+che 31895
+cto 31845
+bei 31784
+ubl 31757
+nan 31752
+eso 31653
+plo 31620
+bje 31511
+fec 31500
+rap 31356
+inv 31288
+gar 31218
+pli 31081
+ppl 31016
+qua 30994
+sat 30955
+ank 30946
+cep 30940
+ctu 30900
+cus 30894
+_ea 30871
+imi 30678
+hts 30594
+uss 30536
+rev 30515
+kno 30461
+hor 30460
+sum 30394
+mil 30388
+urt 30279
+rts 30178
+deb 30146
+tle 30098
+pin 30089
+nvi 30070
+sts 30041
+onf 29960
+vie 29938
+tut 29889
+vis 29795
+nno 29782
+ail 29749
+ied 29732
+ete 29592
+ruc 29456
+til 29426
+usi 29382
+wev 29345
+shi 29307
+ger 29260
+gin 29224
+ors 29213
+aff 29210
+_au 29205
+err 29175
+gs_ 29174
+rad 29160
+ute 29155
+eba 29142
+ket 29098
+cor 28942
+gov 28910
+ars 28900
+aki 28858
+atu 28673
+she 28648
+cco 28614
+off 28613
+mos 28563
+pub 28514
+ngs 28505
+dur 28453
+_kn 28451
+eta 28435
+eu_ 28391
+fra 28327
+sto 28299
+udg 28282
+ges 28173
+rn_ 28140
+_ov 28121
+cip 28043
+ck_ 27988
+efe 27987
+hel 27936
+two 27889
+pt_ 27810
+_sy 27779
+car 27762
+wan 27688
+ict 27610
+cra 27564
+rdi 27555
+too 27508
+mai 27502
+rol 27443
+lt_ 27442
+rot 27425
+_du 27424
+ps_ 27347
+pme 27320
+opt 27297
+nse 27253
+mpr 27195
+iew 27179
+rtu 27100
+egu 26986
+fre 26978
+nve 26951
+lev 26840
+met 26838
+ppe 26786
+mal 26758
+far 26757
+ea_ 26747
+lud 26730
+coo 26686
+ema 26664
+hum 26657
+pte 26648
+uma 26513
+mpa 26489
+fai 26465
+oes 26462
+xt_ 26453
+ken 26445
+amm 26250
+let 26241
+ech 26234
+hap 26229
+del 26219
+bud 26211
+dat 26206
+nic 26189
+mpe 26153
+ecu 26142
+ask 26066
+sla 26066
+req 25827
+opm 25790
+gio 25725
+len 25687
+hol 25630
+vic 25617
+oni 25607
+cte 25601
+_tw 25497
+evi 25483
+gal 25464
+_jo 25433
+ett 25424
+exa 25361
+sha 25358
+rai 25331
+loy 25294
+rnm 25269
+uth 25209
+asu 25199
+_nu 25175
+ana 25034
+lec 25026
+arm 25011
+aft 24958
+fte 24897
+ibi 24877
+ado 24721
+ret 24698
+die 24688
+los 24605
+yst 24555
+lth 24396
+nor 24288
+_the 2355225
+the_ 2024828
+_of_ 946255
+_to_ 883967
+ion_ 761869
+and_ 758191
+_and 722446
+tion 710245
+ing_ 646234
+_in_ 618406
+hat_ 530522
+_tha 520767
+ent_ 476406
+that 473881
+_is_ 445132
+ment 404122
+atio 377597
+_for 361296
+_com 356179
+_thi 342052
+_pro 316727
+_we_ 305675
+his_ 305106
+_con 298755
+for_ 296530
+this 287078
+_on_ 275454
+comm 262995
+_it_ 256238
+_be_ 246987
+ther 240309
+sion 238043
+_are 226086
+are_ 219728
+port 216767
+_wit 209133
+with 207998
+not_ 206227
+_eur 203048
+_not 201410
+ould 199536
+_whi 198967
+uld_ 198943
+_hav 198818
+ons_ 198766
+euro 197605
+ave_ 197087
+_pre 196480
+rope 193090
+have 190644
+_as_ 189392
+ions 188577
+ich_ 187573
+urop 187050
+hich 185989
+whic 185738
+ommi 182929
+_cou 182279
+ted_ 181310
+pres 177875
+ies_ 176431
+_par 173182
+ith_ 170087
+here 165803
+ssio 165092
+ill_ 160230
+ity_ 157473
+ere_ 155479
+side 152740
+ean_ 151252
+_by_ 143300
+coun 142037
+_sta 141268
+nce_ 141113
+pean 141044
+will 141043
+opea 141022
+_wil 140775
+miss 140489
+ive_ 139879
+issi 139631
+_spe 137805
+_int 135602
+iden 132925
+ate_ 132702
+mmis 131166
+amen 129686
+tive 129316
+ble_ 127914
+_has 126995
+has_ 126528
+_res 124458
+all_ 123592
+emen 121099
+ort_ 120687
+her_ 119816
+dent 119402
+our_ 119206
+ers_ 118724
+ting 117934
+ame_ 117139
+resi 117056
+een_ 116283
+nts_ 116127
+esid 115565
+_mr_ 114857
+ore_ 114080
+_all 108825
+ust_ 108452
+_sho 107138
+mber 104386
+_rep 103308
+_imp 102272
+peak 101214
+spea 101192
+nal_ 100990
+_at_ 100051
+ure_ 99271
+inte 98474
+lly_ 97916
+stat 97024
+ecti 96931
+name 96750
+_nam 96632
+out_ 95975
+_can 94510
+eake 94495
+_uni 94081
+ctio 93895
+aker 93829
+sed_ 93536
+ess_ 93277
+ker_ 93178
+_id_ 92994
+_you 92535
+_wou 92484
+_pol 92306
+woul 92233
+ents 92211
+able 91729
+ight 91682
+_but 90508
+but_ 90065
+part 89771
+_wor 89539
+tate 89455
+_an_ 88909
+poli 88767
+ount 87984
+ter_ 87332
+ial_ 87061
+thin 86902
+rati 86030
+tes_ 85878
+shou 85565
+houl 85471
+ally 85361
+ber_ 84596
+use_ 84470
+embe 84390
+_als 83862
+lso_ 83843
+also 83719
+_our 83392
+age_ 83367
+enti 83233
+nion 83147
+onal 83000
+cons 82888
+one_ 82622
+_fro 82344
+arli 81827
+_reg 81166
+_mus 80766
+iona 80739
+nter 80654
+rom_ 79595
+must 79310
+from 79288
+prop 79249
+liam 78427
+parl 78425
+iame 78421
+rlia 78347
+ant_ 78113
+cial 77071
+ates 76566
+over 76325
+_bee 76116
+memb 76002
+ever 75894
+cont 75865
+ctiv 75512
+ical 75305
+ding 75060
+comp 74595
+ence 74450
+very 74355
+reat 74331
+_mem 73969
+been 73750
+lati 72895
+ome_ 71866
+nati 71802
+ely_ 71070
+ake_ 70274
+itio 70248
+_app 70180
+_whe 70112
+epor 69775
+ance 69715
+can_ 69637
+repo 69634
+_tra 69540
+unio 69395
+ver_ 69310
+ppor 69265
+spec 69147
+_rea 69019
+_dis 68943
+ple_ 68652
+_mor 68514
+work 68399
+you_ 68248
+_was 66494
+ope_ 66390
+its_ 66360
+othe 66216
+cal_ 66131
+_its 65688
+ral_ 65599
+ary_ 65168
+ncil 65104
+ery_ 65055
+more 64871
+utio 64504
+ounc 64320
+untr 64027
+_tak 63747
+der_ 63569
+king 63464
+conc 63441
+ropo 63008
+any_ 62555
+fore 62458
+efor 62097
+cess 62017
+ese_ 61957
+was_ 61575
+take 61562
+ries 61430
+unci 61390
+_pos 61159
+ect_ 61150
+_acc 60899
+arti 60793
+ned_ 60411
+unit 60262
+cil_ 60210
+ght_ 60179
+econ 59824
+what 59312
+gree 59185
+form 59164
+_who 58992
+eed_ 58903
+evel 58878
+thes 58869
+opos 58865
+_or_ 58802
+mmit 58734
+inst 58481
+icul 58350
+_agr 58275
+prov 58115
+like 58102
+hese 58057
+ain_ 58043
+_ver 57918
+ring 57735
+_wha 57638
+ning 57103
+_eve 57065
+now_ 56883
+ture 56811
+_lan 56808
+ces_ 56735
+_lik 56681
+_sec 56552
+sure 56224
+hey_ 56192
+they 56190
+ntri 56096
+ear_ 55900
+_if_ 55835
+_fin 55680
+impo 55624
+_do_ 55485
+ike_ 55374
+_rig 55231
+ties 55197
+olic 55154
+hen_ 55112
+_str 55031
+_inc 54864
+tly_ 54623
+righ 54569
+reas 54522
+enta 54366
+rese 54174
+_exp 54136
+acti 53908
+_so_ 53840
+esti 53811
+once 53736
+ose_ 53578
+hing 53543
+_oth 53531
+_one 53333
+nly_ 53145
+lity 53096
+lang 53043
+ough 52861
+uch_ 52435
+_act 52188
+_bec 52167
+nder 52122
+tain 52004
+_no_ 51900
+time 51744
+ngua 51705
+angu 51681
+_mea 51540
+uage 51438
+ause 51421
+guag 51412
+stan 51389
+ime_ 51170
+oint 51089
+ress 50950
+_nee 50787
+need 50783
+heir 50754
+thei 50622
+_sup 50581
+mpor 50516
+itte 50504
+eir_ 50362
+_how 50340
+some 49883
+mple 49805
+_som 49750
+_abo 49741
+_rec 49728
+ilit 49589
+red_ 49525
+mend 49475
+sent 49346
+_ind 49290
+ous_ 49280
+_pri 49278
+rtic 49264
+sing 49143
+mitt 49107
+erat 48947
+ded_ 48764
+_mak 48390
+onsi 48176
+_dec 48046
+trie 48046
+_per 48034
+caus 47986
+_man 47803
+ves_ 47748
+resp 47733
+nmen 47718
+ated 47437
+orta 47428
+_ame 47372
+_tim 47316
+_cha 47234
+ject 46998
+than 46993
+_out 46986
+even 46538
+abou 46519
+agre 46473
+unde 46465
+rate 46304
+supp 46288
+_gro 46214
+tant 46016
+_ins 45743
+refo 45708
+rtan 45526
+_tho 45507
+_pla 45282
+_my_ 45138
+ques 44975
+ice_ 44940
+soci 44608
+tern 44486
+tica 44468
+ork_ 44377
+_und 44176
+_suc 43990
+come 43954
+uest 43916
+ffic 43571
+_mad 43534
+tee_ 43351
+poin 43144
+_us_ 43136
+_gen 43113
+ade_ 43040
+_fac 43029
+res_ 43016
+pect 42915
+_mar 42590
+rect 42578
+_dev 42539
+rity 42522
+liti 42364
+posa 42294
+osal 42257
+act_ 42217
+est_ 42192
+licy 42139
+icy_ 42116
+proc 42092
+bili 42001
+ible 41892
+ven_ 41892
+_fir 41551
+oduc 41462
+rodu 41462
+bout 41322
+ulat 41274
+ieve 41188
+ativ 41052
+ople 41010
+eopl 40983
+peop 40981
+_ref 40966
+_peo 40900
+only 40839
+leme 40812
+_onl 40787
+mmun 40754
+year 40720
+ard_ 40718
+_yea 40689
+muni 40615
+_bet 40584
+_nat 40539
+ttee 40440
+roce 40385
+ecau 40381
+ast_ 40156
+itic 40156
+ses_ 40156
+ious 40085
+tabl 40023
+_soc 39981
+beca 39931
+ntio 39897
+lear 39828
+aid_ 39786
+who_ 39687
+isio 39663
+ommu 39636
+ish_ 39633
+nity 39599
+gain 39551
+uppo 39523
+elop 39382
+velo 39362
+deve 39244
+fina 39171
+_see 39120
+tal_ 39116
+atte 39048
+oper 38853
+_eco 38829
+_poi 38808
+crea 38781
+eral 38718
+ncer 38701
+_leg 38695
+_now 38598
+just 38577
+cati 38537
+cts_ 38531
+_new 38487
+_any 38275
+cond 38258
+_gre 38249
+_rel 38158
+itie 37816
+rogr 37794
+onom 37792
+stio 37773
+cour 37769
+_eff 37628
+prog 37628
+make 37592
+_up_ 37580
+clea 37569
+tter 37536
+_giv 37389
+_thr 37264
+rest 37196
+hose 37193
+call 37096
+dire 37063
+ione 37057
+fact 37043
+esen 37008
+cult 37005
+irec 36987
+sibl 36947
+grou 36841
+_sub 36774
+erna 36763
+dmen 36583
+_dem 36572
+ndme 36520
+siti 36497
+endm 36471
+cono 36469
+_aga 36357
+ved_ 36348
+ise_ 36325
+agai 36319
+new_ 36314
+eren 36257
+_que 36225
+try_ 36215
+mark 36185
+ase_ 36136
+irst 36041
+_dir 36024
+tati 35880
+ugh_ 35878
+_her 35852
+rly_ 35840
+icat 35839
+firs 35724
+ific 35563
+fere 35558
+thou 35498
+int_ 35426
+_jus 35425
+day_ 35344
+_ser 35342
+entl 35286
+prob 35270
+ular 35074
+les_ 35067
+acce 35043
+issu 34949
+iati 34940
+own_ 34934
+rent 34883
+rds_ 34874
+_wel 34819
+tran 34758
+posi 34729
+_iss 34682
+ocia 34681
+ontr 34662
+cern 34624
+deci 34584
+_bel 34575
+olit 34572
+ssue 34503
+_say 34430
+appr 34384
+serv 34368
+cula 34262
+_mon 34256
+ost_ 34106
+vent 33967
+them 33924
+renc 33894
+give 33823
+way_ 33806
+ree_ 33786
+ace_ 33778
+ans_ 33776
+when 33725
+prod 33643
+ures 33601
+ving 33548
+rans 33543
+ner_ 33491
+eing 33422
+led_ 33286
+stru 33283
+read 33178
+nclu 32971
+pera 32932
+ange 32922
+oble 32912
+_am_ 32909
+men_ 32901
+als_ 32880
+impl 32803
+peci 32750
+_cle 32708
+nfor 32699
+robl 32690
+ncy_ 32689
+into 32661
+man_ 32650
+eref 32554
+such 32526
+_fun 32468
+nds_ 32443
+titu 32442
+eve_ 32424
+blem 32421
+orit 32385
+_hea 32378
+_ter 32365
+ster 32316
+duct 32290
+art_ 32239
+llow 32157
+_vot 32145
+nto_ 32138
+rovi 32103
+ntin 32055
+_inf 32025
+diff 32017
+cent 31993
+ency 31932
+thos 31801
+olut 31800
+_use 31791
+ong_ 31575
+osit 31569
+fect 31468
+ticu 31449
+pose 31418
+_bas 31365
+tent 31362
+reso 31313
+ppro 31246
+nomi 31241
+_dif 31231
+ecis 31183
+sal_ 31118
+bjec 31102
+_inv 31091
+late 31047
+ener 31024
+roup 30988
+disc 30922
+oner 30903
+ling 30874
+poss 30869
+ssib 30845
+cept 30766
+solu 30766
+rst_ 30690
+_min 30686
+arge 30643
+ains 30623
+ghts 30581
+hts_ 30575
+ine_ 30568
+end_ 30550
+ossi 30523
+atin 30493
+mes_ 30429
+rela 30370
+_bei 30363
+ween 30342
+twee 30341
+betw 30338
+etwe 30338
+_way 30261
+ural 30254
+_lea 30250
+ote_ 30169
+stra 30149
+bein 30053
+know 30051
+howe 30037
+sts_ 30033
+_cri 29992
+mic_ 29992
+_deb 29974
+conf 29868
+rts_ 29827
+arly 29754
+rder 29693
+ours 29670
+arke 29609
+erta 29590
+orde 29557
+ubli 29546
+_ext 29508
+esse 29440
+riti 29362
+ied_ 29349
+ctor 29345
+weve 29345
+owev 29343
+ide_ 29159
+espo 29148
+ood_ 29129
+fund 29084
+made 29065
+eeme 28989
+omic 28942
+stit 28920
+spon 28859
+ffer 28853
+essi 28830
+were 28735
+area 28714
+niti 28588
+luti 28565
+ell_ 28553
+vote 28541
+vern 28519
+regi 28468
+publ 28465
+ogra 28351
+ebat 28349
+nsti 28335
+trat 28329
+gove 28322
+deba 28300
+many 28296
+elie 28239
+ives 28204
+_ass 28171
+espe 28107
+reem 28087
+_ove 28056
+ffec 28010
+_eu_ 27962
+rega 27890
+sati 27873
+demo 27858
+ems_ 27853
+ind_ 27831
+_wer 27818
+_off 27794
+_sit 27779
+real 27767
+rket 27756
+ced_ 27745
+ntal 27741
+chan 27729
+_kno 27642
+bate 27609
+tary 27563
+hink 27553
+itut 27535
+ars_ 27417
+_sin 27416
+grea 27352
+beli 27314
+acco 27265
+pmen 27247
+han_ 27198
+tic_ 27195
+view 27167
+gard 27129
+term 27105
+egar 27018
+_emp 26998
+long 26994
+ider 26972
+say_ 26936
+udge 26902
+hem_ 26823
+_fre 26748
+cisi 26717
+ease 26713
+eate 26698
+_coo 26601
+liev 26576
+blic 26507
+_mat 26462
+tanc 26451
+ext_ 26450
+oes_ 26371
+uati 26370
+elat 26300
+ethe 26252
+tiat 26238
+_cas 26172
+ink_ 26128
+orte 26125
+_hum 26038
+get_ 26007
+pons 26004
+stri 25994
+clud 25982
+uman 25973
+huma 25955
+ndin 25929
+then 25918
+_wan 25899
+want 25894
+_tre 25886
+gram 25883
+urse 25847
+requ 25814
+ntly 25809
+opme 25784
+lopm 25783
+ound 25778
+akin 25744
+inal 25740
+mean 25720
+lic_ 25685
+ramm 25645
+ite_ 25629
+nsid 25619
+ards 25574
+most 25554
+lega 25543
+wher 25508
+main 25472
+truc 25472
+tand 25416
+diti 25403
+_too 25352
+cert 25328
+reco 25304
+rnme 25251
+_pub 25250
+sis_ 25243
+ues_ 25214
+tura 25182
+ater 25175
+ernm 25140
+amme 25132
+ual_ 25096
+_exa 25059
+ucti 25050
+_rem 24970
+trea 24943
+ngs_ 24942
+mati 24938
+anno 24936
+ploy 24857
+roug 24842
+how_ 24841
+ortu 24784
+rtai 24770
+ruct 24758
+empl 24733
+prot 24723
+lar_ 24720
+_gov 24715
+ings 24705
+_cre 24688
+asur 24676
+nanc 24674
+easu 24670
+appl 24595
+_bud 24549
+ntro 24549
+denc 24544
+stem 24467
+ens_ 24438
+oup_ 24431
+_att 24406
+ears 24354
+eat_ 24349
+budg 24338
+dget 24328
+ward 24316
+_sha 24244
+mini 24203
+_cer 24193
+rse_ 24184
+alis 24179
+ken_ 24177
+_vie 24122
+_far 24103
+mplo 24078
+yste 24053
+_car 24024
+alth 24020
+tuti 24005
+gion 23992
+rove 23963
+info 23926
+rms_ 23898
+ders 23879
+rthe 23846
+inan 23806
+syst 23794
+nted 23792
+_des 23786
+_req 23773
+inat 23754
+orma 23652
+plac 23627
+gene 23592
+_his 23574
+_fra 23567
+meas 23556
+onst 23540
+_sys 23487
+_exc 23468
+_env 23310
+stab 23255
+gula 23244
+expe 23234
+lect 23225
+case 23217
+ole_ 23200
+regu 23157
+egul 23150
+egio 23119
+ach_ 23093
+tuat 23085
+ultu 23009
+ltur 23003
+ness 22985
+_dea 22981
+iste 22975
+ying 22929
+_ope 22897
+ocra 22872
+rdin 22870
+ian_ 22851
+envi 22845
+lace 22819
+tely 22801
+itua 22776
+sult 22771
+_add 22754
+grat 22750
+onti 22737
+_doe 22681
+does 22680
+_two 22616
+nst_ 22605
+ensi 22591
+situ 22576
+_sti 22557
+ays_ 22554
+cted 22531
+ncre 22490
+two_ 22475
+tere 22469
+ket_ 22445
+_cit 22422
+ende 22405
+appo 22361
+und_ 22346
+ince 22313
+_ado 22303
+ompl 22301
+iew_ 22295
+less 22295
+rote 22294
+ibil 22286
+bers 22240
+well 22234
+mrs_ 22203
+ymen 22200
+_mrs 22191
+riou 22144
+ady_ 22128
+vide 22120
+_rap 22117
+nces 22094
+adop 22087
+dopt 22087
+sue_ 22076
+cann 22036
+iron 22012
+tem_ 21983
+eady 21958
+fort 21937
+tial 21935
+anis 21909
+onme 21901
+orts 21887
+had_ 21863
+ines 21862
+larg 21844
+mocr 21841
+emoc 21828
+nnot 21823
+_cal 21800
+_had 21797
+cces 21786
+coul 21752
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/fr.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/fr.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/fr.ngp (working copy)
@@ -1,1002 +1,3060 @@
-# NgramProfile generated at Sat Sep 25 16:06:35 EEST 2004 for Nutch Language Identification
-ngram_count 19998293
-_ 1278494
-e 987991
-s 562955
-n 533957
-i 493367
-t 488608
-a 454125
-r 453248
-o 429283
-u 391411
-e_ 383931
-l 345842
-s_ 296082
-d 273546
-c 237694
-p 221520
-m 209333
-t_ 168426
-é 164975
-es 162173
-on 151953
-en 144774
-de 132052
-es_ 124016
-le 123844
-nt 122846
-n_ 106976
-re 102672
-v 87398
-ti 85247
-r_ 81584
-q 80569
-qu 80327
-me 78774
-ou 78550
-nt_ 74666
-ur 74564
-ns 74331
-la 74133
-ent 73427
-io 68070
-er 67958
-ion 65377
-f 64953
-te 64790
-co 64629
-an 63271
-it 62844
-is 62551
-ue 62216
-ce 61950
-a_ 59418
-g 58654
-ai 58314
-on_ 54882
-ne 53841
-b 51101
-que 50913
-et 50506
-ra 49716
-in 49709
-re_ 49497
-ent_ 48883
-ns_ 48796
-po 48189
-se 47302
-ro 46392
-at 46287
-si 46173
-ion_ 45902
-em 45845
-pr 45011
-tio 44394
-tion 44380
-tr 43697
-eu 43165
-u_ 42879
-pa 41814
-us 41504
-men 41212
-ue_ 40471
-st 40443
-au 40418
-ons 40266
-un 39111
-ar 38419
-les 38377
-ment 37789
-ie 37681
-or 35340
-li 34986
-no 34789
-om 34386
-ta 34110
-i_ 33727
-ir 32444
-ur_ 32270
-ve 32207
-ss 31276
-il 31023
-h 30971
-us_ 30924
-ri 30499
-Ã 30295
-eme 30266
-ut 30164
-er_ 30106
-ré 30026
-l_ 29504
-ati 29408
-so 29352
-emen 29275
-j 29106
-oi 29103
-da 28567
-des 28533
-el 28471
-con 28332
-é_ 28104
-x 28063
-ne_ 27954
-eur 27741
-té 27555
-ma 26816
-du 26413
-nc 26293
-ons_ 26054
-ui 26040
-al 25938
-rt 25416
-mm 25373
-le_ 24738
-pe 24540
-te_ 23773
-è 23582
-our 23353
-di 23331
-est 23013
-mi 22983
-nd 22974
-ous 22967
-dé 22800
-par 22793
-ous_ 22666
-com 22259
-atio 22187
-ni 21948
-ll 21908
-vo 21720
-ci 21715
-su 21435
-op 21199
-és 20609
-sa 20543
-omm 20361
-ée 20288
-as 19927
-tre 19922
-ant 19778
-na 19666
-ont 19637
-is_ 19347
-nou 19082
-ts 19069
-pro 19063
-it_ 19059
-ts_ 19005
-lu 18895
-res 18850
-ct 18703
-ire 18398
-nn 17798
-av 17553
-ans 17332
-lo 17285
-pou 17199
-rs 17148
-té_ 17134
-pl 17011
-lle 16762
-je 16683
-ec 16611
-comm 16555
-ch 16430
-mo 16423
-nous 16370
-to 16278
-une 16273
-me_ 16192
-st_ 16126
-ic 16054
-ac 15595
-ét 15462
-os 15456
-tre_ 15383
-ui_ 15354
-dan 15346
-pour 15276
-iq 15272
-iqu 15272
-ssi 15065
-x_ 15045
-ans_ 14863
-rop 14695
-ions 14686
-mp 14661
-qui 14633
-ique 14550
-ux 14429
-ce_ 14428
-do 14355
-y 14182
-bl 14124
-vi 14051
-ér 13965
-fa 13893
-iss 13840
-ol 13781
-ap 13754
-nce 13678
-fi 13584
-ces 13579
-our_ 13570
-ca 13431
-ux_ 13365
-ell 13134
-sio 13078
-sion 13076
-éc 13075
-im 13068
-dans 13046
-rs_ 13041
-nte 12940
-elle 12910
-res_ 12844
-ait 12843
-tt 12811
-pp 12768
-ant_ 12755
-id 12726
-ais 12724
-air 12688
-lem 12495
-que_ 12348
-rai 12244
-ort 12135
-iv 12084
-aire 12075
-ité 12035
-ter 12019
-ien 11964
-fo 11944
-iti 11938
-mme 11914
-nne 11869
-pé 11842
-sur 11838
-ire_ 11797
-pré 11771
-leme 11762
-dr 11705
-ge 11679
-as_ 11527
-tu 11490
-am 11148
-mis 11082
-uv 11077
-oc 10903
-pas 10835
-ale 10716
-rés 10622
-ég 10603
-son 10475
-ul 10475
-ab 10406
-pos 10392
-tra 10361
-por 10242
-se_ 10214
-eur_ 10200
-cti 10072
-uro 10031
-port 9998
-les_ 9975
-int 9942
-ex 9940
-Ã l 9860
-ê 9851
-ntr 9806
-tou 9805
-euro 9731
-va 9693
-ir_ 9689
-onn 9638
-ues 9634
-gr 9534
-né 9476
-ure 9473
-ag 9445
-ait_ 9433
-app 9402
-out 9368
-ité_ 9327
-aut 9326
-ain 9283
-ot 9233
-mes 9201
-cu 9165
-és_ 9128
-if 9110
-ect 9069
-tte 9069
-lit 9064
-urop 9062
-gi 9040
-cons 9022
-èr 9010
-ère 9010
-ens 8997
-rm 8926
-ten 8873
-ett 8855
-ga 8796
-ut_ 8792
-ssio 8769
-ais_ 8760
-sp 8754
-miss 8697
-ouv 8681
-ont_ 8644
-sti 8643
-ar_ 8607
-aux 8537
-mai 8514
-mmi 8508
-mb 8475
-end 8433
-lle_ 8406
-ive 8378
-lé 8356
-rd 8341
-ble 8309
-mmis 8261
-ide 8245
-ommi 8244
-enc 8137
-urs 8133
-iè 8130
-en_ 8036
-ren 8006
-ques 7983
-opé 7977
-rc 7929
-sé 7914
-ad 7867
-ia 7854
-mon 7844
-onc 7838
-tai 7806
-he 7799
-nsi 7755
-ie_ 7749
-ser 7748
-nce_ 7730
-tan 7706
-ieu 7677
-ff 7665
-tat 7660
-oit 7656
-omme 7618
-urs_ 7614
-art 7605
-fai 7575
-prés 7539
-cr 7512
-ins 7506
-rn 7478
-issi 7473
-ée_ 7467
-den 7439
-lus 7364
-la_ 7358
-nts 7358
-nts_ 7357
-nti 7356
-ha 7351
-bi 7327
-ess 7310
-éta 7253
-anc 7163
-sse 7144
-uve 7128
-éen 7111
-d_ 7106
-ran 7070
-pée 7067
-plu 7017
-ropé 6951
-opée 6942
-péen 6942
-rat 6897
-ven 6887
-c_ 6833
-sen 6781
-br 6754
-ei 6665
-pri 6650
-ièr 6647
-ière 6647
-tiq 6604
-tiqu 6604
-sit 6592
-de_ 6583
-ev 6583
-cet 6578
-ette 6573
-tes 6542
-nes 6512
-ine 6474
-ues_ 6468
-plus 6455
-ig 6400
-tte_ 6393
-in_ 6390
-nse 6387
-est_ 6379
-uti 6354
-ère_ 6352
-uni 6332
-ern 6311
-vou 6286
-ib 6274
-cer 6243
-ite 6243
-nde 6242
-ave 6232
-lus_ 6229
-nta 6201
-cont 6196
-and 6195
-tes_ 6184
-êt 6184
-ob 6171
-ier 6167
-mes_ 6161
-sou 6114
-dent 6089
-ouve 6081
-onne 6077
-tant 6061
-év 6055
-tout 6033
-rap 6020
-part 6008
-leu 6007
-sid 6007
-pu 5986
-rr 5972
-cc 5968
-ise 5940
-leur 5890
-for 5864
-rt_ 5835
-uel 5822
-rta 5817
-nne_ 5803
-enn 5777
-ud 5767
-ence 5762
-uc 5748
-rit 5745
-ep 5708
-ond 5707
-ers 5703
-et_ 5696
-ép 5686
-che 5681
-eurs 5676
-enne 5646
-ba 5626
-dun 5620
-bre 5589
-ron 5574
-rati 5568
-eux 5560
-ble_ 5549
-ési 5542
-ses 5531
-ctio 5526
-cl 5507
-cett 5505
-tie 5496
-ntre 5476
-ieur 5475
-pre 5456
-iden 5431
-ver 5424
-itio 5401
-tiv 5401
-él 5387
-ali 5373
-nf 5369
-une_ 5360
-abl 5359
-ppo 5350
-don 5343
-rti 5340
-rem 5338
-rè 5328
-voi 5309
-emb 5303
-roi 5295
-oir 5282
-sent 5262
-up 5244
-mme_ 5228
-san 5219
-ter_ 5217
-ois 5214
-dre 5212
-rl 5178
-esti 5130
-gra 5118
-man 5097
-per 5097
-dem 5088
-ist 5068
-imp 5066
-rg 5063
-onsi 5057
-rait 5053
-str 5021
-sie 4991
-enta 4963
-ontr 4957
-omp 4954
-mais 4951
-jo 4944
-Ã la 4942
-von 4939
-ris 4938
-ili 4906
-avo 4905
-oit_ 4904
-il_ 4899
-ua 4898
-vr 4893
-ient 4890
-ppor 4868
-ente 4852
-ng 4835
-arl 4822
-rapp 4820
-ea 4814
-ecti 4812
-ées 4802
-ées_ 4799
-fin 4794
-ys 4792
-parl 4791
-era 4790
-ve_ 4788
-ill 4784
-conc 4765
-rme 4765
-pe_ 4764
-ès 4764
-ste 4763
-comp 4756
-pt 4752
-ute 4750
-ance 4747
-inte 4747
-mat 4731
-rési 4715
-ssa 4699
-vons 4697
-oli 4695
-eux_ 4688
-nes_ 4675
-fe 4673
-ès_ 4669
-ents 4656
-arti 4652
-od 4649
-ert 4643
-nv 4638
-prop 4635
-ésid 4635
-tive 4617
-act 4614
-ava 4613
-able 4610
-appo 4609
-ass 4587
-side 4587
-dre_ 4572
-pol 4569
-teu 4559
-enti 4552
-mbr 4519
-rie 4509
-nst 4494
-age 4492
-nom 4492
-bo 4491
-un_ 4488
-ho 4475
-mu 4468
-rle 4467
-arle 4466
-lis 4451
-mbre 4448
-éri 4447
-teur 4438
-ure_ 4437
-tés 4425
-tés_ 4425
-sieu 4424
-rte 4420
-ame 4418
-isa 4409
-cha 4398
-ier_ 4386
-oin 4386
-orm 4378
-entr 4377
-osi 4369
-sem 4366
-z 4362
-acc 4356
-siti 4343
-ls 4337
-dev 4334
-ef 4326
-dis 4319
-êtr 4318
-être 4317
-posi 4311
-rec 4293
-mpl 4291
-osit 4290
-pen 4263
-sont 4252
-ra_ 4237
-lon 4235
-ord 4215
-jou 4213
-éenn 4206
-lat 4196
-opo 4184
-ale_ 4176
-itiq 4176
-ém 4172
-vent 4161
-rd_ 4157
-eau 4147
-nio 4139
-éd 4133
-peu 4130
-èm 4129
-ème 4129
-nion 4128
-og 4096
-poli 4090
-cel 4088
-tur 4084
-lité 4072
-ien_ 4069
-ort_ 4059
-tro 4053
-nte_ 4050
-itu 4046
-ois_ 4041
-nter 4036
-cor 4035
-ge_ 4025
-mé 4024
-utr 4016
-nat 4012
-ls_ 4004
-esp 3998
-liti 3985
-ay 3983
-éra 3983
-dir 3972
-emp 3970
-uis 3968
-al_ 3966
-ens_ 3957
-si_ 3955
-ropo 3951
-olit 3946
-tit 3943
-nan 3936
-gu 3933
-rlem 3932
-ica 3931
-éga 3926
-éf 3910
-ru 3908
-eil 3907
-nu 3901
-oute 3900
-gn 3899
-cou 3892
-déc 3887
-ec_ 3884
-oir_ 3875
-quel 3867
-aux_ 3863
-nté 3840
-été 3820
-ina 3819
-mons 3817
-ela 3806
-cest 3800
-mpo 3799
-utio 3799
-tif 3797
-ces_ 3793
-lun 3787
-voir 3787
-fait 3782
-unio 3772
-min 3766
-vec 3765
-ori 3759
-avec 3754
-vec_ 3754
-sei 3751
-nem 3743
-sta 3743
-out_ 3734
-tair 3725
-égi 3720
-ici 3719
-état 3717
-ndr 3716
-én 3711
-lan 3710
-fon 3704
-ses_ 3701
-rais 3696
-lles 3687
-opos 3683
-mati 3679
-nal 3658
-ani 3645
-nsie 3642
-stio 3642
-aine 3638
-rou 3635
-Ã c 3608
-its 3604
-its_ 3585
-lai 3583
-neme 3583
-vous 3579
-af 3573
-ése 3567
-lè 3564
-doi 3560
-ats 3559
-ires 3558
-rv 3553
-utre 3547
-ats_ 3545
-uss 3541
-form 3540
-dire 3538
-autr 3536
-rése 3502
-be 3499
-ime 3499
-nci 3498
-der 3496
-um 3485
-el_ 3470
-vel 3460
-dro 3457
-ju 3434
-lor 3433
-sc 3432
-hé 3421
-rne 3413
-fr 3411
-sai 3411
-soi 3405
-vai 3403
-roc 3394
-pay 3390
-rès 3385
-rès_ 3385
-ive_ 3384
-spo 3376
-luni 3374
-mun 3374
-met 3361
-onse 3352
-ére 3352
-cia 3332
-nda 3331
-lati 3330
-cul 3320
-bu 3315
-mem 3304
-at_ 3303
-roit 3301
-main 3297
-ture 3297
-impo 3295
-proc 3287
-mmu 3280
-oci 3276
-not 3270
-mmun 3265
-oy 3263
-jour 3254
-ifi 3250
-ussi 3248
-aus 3245
-ppe 3245
-ommu 3244
-dam 3242
-tri 3235
-erm 3229
-fic 3215
-rer 3211
-cit 3181
-alem 3180
-tic 3180
-droi 3173
-ays 3170
-pays 3169
-ema 3165
-erne 3158
-ins_ 3158
-rité 3158
-gal 3157
-att 3155
-éci 3154
-uest 3151
-gé 3147
-tem 3145
-tent 3139
-ys_ 3133
-ays_ 3128
-cé 3126
-ncer 3121
-ial 3114
-nati 3113
-oi_ 3091
-rce 3088
-ndi 3074
-sat 3070
-inc 3068
-ini 3066
-once 3066
-cat 3063
-nis 3060
-non 3058
-lut 3056
-ine_ 3052
-fé 3050
-ail 3046
-xi 3041
-ié 3034
-ara 3026
-êm 3026
-ême 3026
-mer 3025
-dune 3021
-col 3019
-ande 3017
-mpor 3011
-van 3011
-cte 3005
-lie 3004
-ye 3003
-ner 2997
-vis 2995
-otr 2986
-os_ 2985
-erc 2980
-ita 2980
-otre 2978
-uj 2978
-ose 2975
-z_ 2971
-égal 2958
-dép 2957
-ers_ 2955
-lin 2955
-ille 2947
-len 2942
-sq 2940
-squ 2940
-cie 2936
-tats 2932
-éco 2930
-ésen 2929
-mar 2928
-sui 2926
-rég 2925
-isi 2924
-ense 2920
-eff 2917
-ite_ 2917
-lt 2915
-qua 2913
-isse 2907
-issa 2906
-bie 2901
-fair 2894
-ip 2894
-rav 2883
-rer_ 2882
-nde_ 2881
-reme 2877
-gue 2868
-orte 2861
-amen 2856
-ign 2855
-rtan 2850
-orta 2846
-ô 2846
-embr 2844
-sati 2839
-ez 2836
-ez_ 2830
-èg 2827
-lar 2824
-uit 2817
-ndre 2815
-ains 2809
-endr 2805
-bil 2789
-ser_ 2783
-soc 2771
-elo 2767
-uell 2764
-dit 2761
-ctiv 2751
-pi 2748
-née 2741
-ors 2741
-bli 2740
-nir 2736
-ise_ 2733
-k 2732
-dra 2731
-éa 2730
-erv 2728
-Ã ce 2728
-rep 2727
-ate 2726
-omi 2724
-moi 2716
-go 2708
-tal 2703
-auss 2700
-soci 2696
-nir_ 2694
-ote 2691
-uer 2687
-deu 2683
-tati 2682
-oup 2680
-mê 2678
-jet 2674
-ub 2671
-mêm 2662
-même 2662
-bien 2661
-arc 2658
-ctu 2658
-ai_ 2654
-nsei 2647
-cert 2638
-gl 2628
-ult 2628
-pens 2626
-ilit 2620
-ssi_ 2617
-ème_ 2614
-trai 2611
-rel 2603
-vé 2600
-rtic 2589
-ssai 2589
-cla 2574
-cess 2573
-sant 2569
-eil_ 2565
-gale 2557
-ura 2552
-ona 2549
-seil 2548
-sol 2548
+# NgramProfile generated at Tue May 31 02:05:48 CEST 2005 for Nutch Language Identification
+e 21070115
+s 11897941
+n 11353732
+i 10470143
+t 10246513
+a 9905135
+r 9701664
+o 8934481
+u 8189598
+l 7375555
+d 5836574
+p 5047585
+c 5019869
+m 4527908
+é 3491224
+v 1812713
+q 1639229
+f 1350380
+g 1340670
+b 1089956
+h 658604
+à645802
+j 601380
+x 565542
+è 490962
+y 304283
+ê 214678
+k 156964
+z 94969
+ô 60438
+ç 33937
+î 27933
+û 25227
+ù 24421
+w 22116
+â 20411
+ö 6608
+ï 4867
+ë 2994
+á 2932
+à2482
+ü 2012
+ä 1980
+ó 1885
+º 1590
+æ 719
+ò 417
+ñ 378
+ø 249
+ã 246
+ß 202
+ú 146
+Ã¥ 122
+ì 40
+µ 8
+õ 4
+ý 4
+ð 3
+þ 1
+e_ 8157456
+s_ 6237081
+_d 4274134
+t_ 3541659
+_l 3415324
+es 3384039
+on 3166798
+en 3066694
+_p 2969615
+de 2728813
+nt 2564370
+le 2508976
+n_ 2372049
+_e 2358459
+_c 2351190
+re 2153241
+_a 2047069
+r_ 1820120
+ti 1788021
+_s 1732367
+me 1728052
+qu 1633685
+ou 1602127
+ur 1566459
+ns 1549697
+er 1545302
+la 1428121
+io 1413751
+a_ 1401009
+an 1395638
+co 1377756
+te 1343488
+is 1319516
+it 1307804
+ue 1291652
+l_ 1278169
+ai 1220643
+ce 1209815
+_m 1121020
+_n 1116449
+ne 1071607
+ra 1062419
+et 1055990
+_q 1047808
+in 1031959
+po 1008183
+si 997418
+se 983414
+ro 971010
+at 970272
+pr 965778
+em 964012
+_i 939528
+eu 922941
+tr 915727
+u_ 898974
+_r 893677
+pa 883409
+us 855311
+st 837186
+au 823628
+un 821923
+ar 810582
+ie 800107
+or 772064
+_u 764493
+_t 734345
+ta 719208
+d_ 715550
+om 714719
+i_ 701124
+no 689645
+ir 681708
+ve 671248
+il 668909
+ss 668271
+li 662498
+ré 647943
+à_ 645588
+ri 642850
+ut 613973
+é_ 603359
+pe 600478
+_à596973
+so 593765
+oi 591983
+el 587736
+té 579889
+_f 571912
+ma 568311
+nc 550386
+rt 546092
+al 543936
+ui 534087
+_é 528937
+mm 521343
+nd 494640
+mi 484597
+ni 484204
+_v 482186
+_o 472141
+na 465336
+su 460798
+ll 460388
+és 452394
+di 445219
+du 443587
+ci 437555
+da 435844
+op 435312
+vo 434144
+dé 425385
+ée 424739
+_j 414423
+as 411783
+ts 395772
+sa 392956
+id 384253
+ct 382587
+av 378132
+nn 372278
+rs 364164
+ec 352551
+pl 352491
+mo 352219
+ch 345997
+ic 342226
+to 340832
+ét 329342
+am 327762
+iq 326127
+ac 324055
+je 316655
+os 312451
+mp 309581
+x_ 309109
+_b 305287
+bl 304393
+p_ 298621
+ux 296132
+lu 295336
+ge 294588
+ap 293824
+ér 290255
+fi 289104
+vi 288662
+ca 288308
+fa 286844
+pp 284194
+ol 283271
+lo 278611
+do 276755
+im 276574
+sp 275937
+éc 275933
+tt 266902
+ag 256125
+pé 253457
+iv 249025
+fo 242311
+tu 242151
+c_ 234761
+dr 232655
+_g 226838
+uv 225367
+ul 224104
+oc 221766
+va 219178
+ab 215324
+ég 210723
+ex 209843
+gr 204246
+né 200951
+cu 200731
+rm 197331
+ot 192807
+ea 184440
+rd 184403
+if 183910
+ga 183524
+èr 181581
+he 177100
+rc 175551
+gi 175135
+mb 172739
+ia 169864
+cr 166303
+iè 163987
+sé 161649
+ff 161526
+_h 159006
+ng 156284
+rn 152285
+ha 151345
+ei 150013
+ad 149158
+ua 148317
+br 148031
+bi 144914
+ig 137509
+gu 136005
+cc 133675
+ev 131750
+ib 131381
+êt 129547
+ob 129135
+lé 127103
+rr 126317
+uc 125731
+év 123573
+pu 121921
+ba 120999
+cl 120820
+ep 120374
+él 118049
+ud 117335
+rè 112929
+nf 111662
+ép 111548
+pt 111441
+up 110592
+rl 109932
+m_ 107940
+rg 107655
+ès 102580
+jo 102448
+ys 100483
+ak 100154
+mu 98950
+fe 97856
+bo 97352
+ke 96977
+vr 96044
+od 95662
+mé 93745
+nv 92645
+éd 91642
+ém 91572
+ef 90261
+_ê 90040
+èm 88660
+gn 88190
+ay 87287
+ls 87204
+og 86020
+nu 85618
+ho 85522
+ru 80360
+sc 79628
+éf 79281
+én 78025
+lè 76645
+bu 74758
+rv 74688
+be 72014
+gé 70918
+um 70859
+hé 70008
+oy 69376
+ju 68581
+fr 67683
+j_ 67420
+lt 67184
+y_ 66545
+êm 65310
+af 63676
+fé 62523
+z_ 62414
+xi 62278
+ié 61464
+ye 61289
+_y 61069
+ub 60642
+ip 59598
+cé 59541
+éa 59525
+uj 59011
+mê 58793
+sq 58425
+èg 58000
+ez 57743
+pi 56776
+go 56233
+gl 56023
+vé 54870
+o_ 51699
+xe 48737
+hu 48083
+hi 47836
+xp 47789
+f_ 47089
+ds 40980
+ix 40371
+ué 40068
+rq 38787
+éb 38329
+éq 37335
+xt 37290
+rê 35660
+bs 35094
+of 35085
+bj 34706
+th 34591
+vu 34178
+tè 34051
+éj 33714
+ug 33485
+ph 32945
+rô 32878
+ps 32831
+ôl 32466
+fl 32409
+aq 31680
+nq 31240
+sm 31167
+uo 30825
+fs 30671
+g_ 30436
+ov 30338
+oo 30046
+sy 29623
+dg 26117
+jà25425
+fu 25067
+ù_ 24417
+où 24416
+sl 24304
+là22816
+aî 22634
+bé 22166
+lq 21616
+uf 21459
+dè 21311
+_k 20881
+xc 20446
+ôt 20353
+uh 20323
+aj 20255
+cè 19523
+ît 19288
+xa 19204
+ço 19073
+oj 18903
+hn 18770
+pê 18117
+êc 17902
+eg 17824
+ya 17731
+pè 17282
+èt 17198
+ed 16913
+oq 16909
+sf 16319
+k_ 15527
+ja 15481
+éo 14812
+aç 14808
+rb 14609
+éu 13577
+gm 13208
+h_ 12948
+dm 12288
+yp 12237
+oe 12182
+âc 11998
+hè 11779
+oh 11751
+yo 11703
+rf 11693
+zo 11603
+_w 11481
+_z 11452
+rp 11452
+lg 11292
+eq 10723
+ka 10723
+nl 10594
+èv 10574
+xé 10474
+dh 10472
+ût 10321
+ki 10217
+b_ 9927
+gè 9794
+ûr 9741
+bt 9680
+oû 9606
+sû 9449
+ck 9391
+tô 9307
+ly 8858
+èn 8843
+ax 8724
+ça 8684
+ko 8678
+èl 8602
+ty 8575
+hy 8196
+nr 8017
+tc 7982
+sd 7971
+sb 7885
+nç 7664
+èc 7520
+ej 7493
+cs 7438
+hr 7239
+yé 7224
+mè 7142
+lh 7129
+eo 7098
+aé 7073
+cô 6987
+yn 6950
+ms 6854
+gt 6804
+ze 6693
+în 6544
+mn 6532
+ôm 6484
+hô 6331
+ld 6305
+eç 6160
+v_ 6071
+râ 5989
+mc 5988
+cq 5949
+nj 5850
+çu 5789
+uq 5731
+wa 5680
+gg 5625
+éh 5512
+nz 5450
+èd 5393
+nm 5280
+sh 4967
+yc 4944
+cy 4942
+az 4924
+ey 4840
+tâ 4778
+lm 4728
+uê 4690
+ox 4648
+dû 4606
+q_ 4595
+lc 4531
+sr 4445
+ii 4442
+aa 4409
+eb 4348
+_x 4292
+ah 4290
+ry 4286
+iz 4258
+eh 4219
+rk 4190
+gh 4154
+ee 4143
+û_ 4103
+sv 4004
+ao 3997
+nh 3983
+vè 3967
+we 3939
+tl 3898
+hl 3873
+ât 3820
+xq 3815
+za 3799
+ij 3793
+_â 3777
+ym 3769
+uè 3733
+wi 3585
+nk 3522
+dd 3406
+ae 3388
+oa 3375
+âg 3355
+zi 3333
+oî 3291
+lb 3284
+éé 3260
+bc 3232
+uy 3216
+dt 3214
+ht 3213
+hm 3159
+ik 3154
+lk 3103
+éi 3102
+dy 3096
+ow 3053
+rç 3050
+lv 2957
+bv 2905
+ël 2726
+sk 2712
+cp 2633
+wo 2621
+vê 2611
+ek 2600
+nè 2568
+fè 2560
+yr 2552
+uz 2518
+aï 2515
+pm 2438
+rh 2415
+sè 2415
+aë 2371
+yl 2343
+kh 2268
+yt 2256
+pô 2237
+ky 2234
+kr 2212
+ks 2211
+sn 2191
+xu 2175
+tz 2139
+by 2122
+ok 2117
+ew 2054
+bâ 2050
+fg 1886
+tê 1858
+_î 1852
+îl 1852
+rz 1716
+lf 1687
+zz 1597
+ny 1595
+º_ 1585
+rö 1577
+ku 1570
+uk 1569
+nb 1568
+cn 1556
+w_ 1550
+èq 1548
+my 1544
+dj 1512
+nº 1500
+oï 1494
+ál 1461
+lz 1389
+xh 1387
+ón 1387
+yd 1374
+iu 1373
+nê 1352
+lp 1339
+lô 1329
+kl 1322
+ör 1253
+zé 1211
+tv 1160
+ln 1151
+ró 1135
+bb 1106
+ös 1106
+sw 1100
+án 1058
+ÃÂn 1052
+ws 1024
+gâ 1021
+än 1021
+cm 1007
+öm 996
+ji 984
+cd 972
+zá 965
+tm 961
+gy 931
+yi 923
+gs 918
+xo 917
+jö 895
+sj 882
+bö 880
+wu 876
+oz 868
+xx 852
+rü 850
+nô 816
+gö 809
+éç 808
+tn 806
+lâ 805
+db 776
+tb 772
+zu 768
+py 764
+pc 746
+ml 744
+js 743
+êv 742
+ïs 740
+ÃÂa 738
+üb 738
+ït 736
+gd 732
+dv 730
+_ç 722
+qv 722
+xy 713
+bw 707
+wh 704
+uï 696
+pn 694
+dz 688
+öt 687
+aw 680
+jk 676
+ên 662
+ïn 661
+rà659
+ôn 650
+ih 649
+jt 644
+gê 618
+pç 616
+yg 611
+wy 600
+oé 591
+rw 573
+km 568
+tà565
+_è 562
+zq 557
+dn 548
+ûm 544
+_á 536
+wl 535
+bd 519
+öd 508
+pä 498
+yb 496
+fm 495
+cà489
+âm 488
+dq 484
+hâ 482
+fû 468
+ék 468
+hö 457
+ön 452
+jé 448
+üh 448
+ná 445
+rû 432
+wm 427
+bæ 425
+æk 425
+bh 418
+pâ 418
+vc 418
+ïr 399
+nw 395
+hw 394
+ïk 393
+sá 391
+ûl 391
+êl 388
+mü 384
+ül 384
+ôp 380
+hä 376
+èb 375
+pv 372
+jn 361
+oë 360
+zn 357
+dü 356
+fê 355
+df 352
+mt 351
+ïq 350
+cf 347
+ïd 341
+sö 339
+âl 339
+hs 335
+dà330
+vs 328
+kj 326
+öl 317
+bn 314
+sg 314
+bk 313
+fâ 311
+ÃÂ_ 310
+kk 308
+dl 307
+dw 306
+iö 306
+çà303
+kt 302
+ó_ 298
+tw 294
+mû 292
+kx 291
+má 289
+dö 286
+är 283
+bè 281
+uu 275
+iê 274
+_ö 273
+mâ 269
+sò 269
+ft 267
+òl 267
+fä 265
+ïb 260
+mf 258
+hc 256
+zè 254
+_ô 251
+lä 251
+äm 251
+öh 249
+eû 248
+uë 246
+kä 244
+ão 244
+ög 241
+éâ 240
+kn 239
+iw 234
+bê 232
+zb 231
+ÃÂe 230
+só 228
+pk 227
+lö 226
+vô 222
+ær 222
+jæ 218
+öc 215
+öw 215
+öö 215
+ør 211
+sà208
+zs 203
+zh 201
+ïw 199
+añ 197
+zl 192
+mg 189
+ün 188
+mh 186
+dk 184
+ë_ 184
+ké 182
+zf 179
+îc 177
+pö 175
+uw 175
+yu 175
+hd 173
+mr 170
+hh 168
+dc 167
+qa 167
+gü 166
+np 165
+fn 164
+tf 164
+yk 164
+kv 163
+vd 160
+wn 160
+fc 157
+jø 156
+tp 156
+ï_ 155
+ß_ 154
+bm 153
+á_ 153
+eï 152
+ño 151
+gb 149
+dp 146
+yh 145
+ló 144
+oè 144
+aß 141
+ò_ 140
+cò 138
+tà137
+xv 137
+ïl 137
+kf 134
+âp 133
+ñe 133
+wt 132
+óp 132
+gp 131
+vl 131
+âb 131
+hj 130
+hk 128
+tg 124
+ár 124
+ïv 121
+cb 120
+pd 119
+câ 118
+ïf 116
+td 115
+tx 115
+pf 106
+yy 105
+iñ 101
+nä 100
+bû 99
+äf 99
+ïc 99
+ûc 99
+nx 98
+iã 97
+ö_ 97
+vä 96
+wé 96
+éz 96
+pg 94
+gc 93
+iy 92
+kg 92
+là91
+vm 90
+àd 90
+êq 89
+_º 88
+cg 87
+äy 87
+cj 85
+cv 85
+ïe 85
+üs 85
+nö 84
+äl 83
+ô_ 83
+ür 83
+hb 81
+ió 81
+fp 80
+tk 78
+wr 78
+rx 77
+rà76
+rj 75
+sä 75
+zr 75
+iâ 74
+md 74
+ä_ 73
+fy 72
+pj 72
+lr 71
+tó 71
+às 71
+ña 70
+îm 69
+yx 68
+bî 66
+hü 66
+ës 66
+lj 65
+gk 64
+çi 64
+_Ã¥ 63
+rã 63
+xf 62
+gv 61
+_ó 59
+dî 58
+zm 58
+pb 57
+tá 57
+jc 54
+mã 53
+oñ 51
+tj 51
+yv 51
+zv 51
+zó 51
+lá 50
+mw 50
+ân 50
+hp 49
+rá 49
+Ã¥r 49
+ún 48
+fb 47
+lü 47
+vp 46
+kö 45
+nâ 45
+cú 43
+vn 43
+xm 43
+è_ 43
+ÃÂg 43
+oç 42
+eé 41
+mà41
+uà41
+yá 41
+aà40
+cw 39
+mô 39
+vg 39
+ái 39
+fd 37
+kp 37
+vv 37
+bp 36
+jm 36
+âi 36
+hê 34
+mó 34
+væ 33
+xd 33
+zc 33
+zk 33
+æg 33
+kw 32
+mk 32
+yz 31
+zy 31
+àv 31
+Ã¥_ 31
+mv 30
+cê 29
+eô 29
+yw 29
+ïa 29
+öv 29
+jü 28
+ßl 28
+eß 27
+eå 27
+hf 27
+mö 27
+ác 27
+üt 27
+fk 26
+ww 26
+ÃÂs 26
+fó 25
+jd 25
+tü 25
+gw 24
+rú 24
+âq 24
+øl 24
+lw 23
+qi 23
+sø 23
+uç 23
+xs 23
+_ø 22
+âs 22
+èf 22
+ÃÂt 22
+ñi 22
+mø 21
+sz 21
+ás 21
+Ã¥s 21
+üd 21
+_ì 20
+sü 20
+vá 20
+zp 20
+æs 20
+ÃÂo 20
+úc 20
+sç 19
+wk 19
+xè 19
+äi 19
+ûs 19
+jú 18
+kb 18
+kd 18
+uß 18
+äc 18
+úa 18
+ræ 17
+uâ 17
+vb 17
+vy 17
+wc 17
+gø 16
+es_ 2592662
+_de 2298898
+de_ 1652022
+nt_ 1567198
+ent 1532503
+ion 1355543
+_le 1355028
+le_ 1203388
+on_ 1198910
+_co 1130453
+_la 1084407
+_qu 1047609
+que 1047001
+la_ 1034858
+re_ 1029499
+ns_ 1004481
+tio 923748
+men 845379
+ue_ 838902
+ons 835445
+les 785357
+et_ 785333
+_pr 772057
+_pa 766047
+ne_ 745327
+er_ 734900
+_l_ 722131
+_un 690433
+ur_ 686897
+_en 685515
+_et 673490
+_ce 630228
+eme 627702
+ati 625696
+us_ 622118
+con 609873
+_po 602429
+_à_ 596863
+en_ 592360
+eur 589540
+des 586700
+_no 574222
+_au 544919
+ce_ 513106
+par 479111
+our 478176
+te_ 477635
+est 471191
+_d_ 468954
+com 467059
+me_ 458557
+ous 453412
+tre 420065
+ant 418003
+is_ 414898
+omm 414494
+_so 406113
+ont 404996
+res 404193
+_es 402481
+it_ 396270
+pro 394807
+ts_ 393101
+ire 386734
+nou 372711
+té_ 367816
+il_ 366163
+ans 362520
+pou 356746
+_in 355959
+_dé 347148
+_re 346287
+lle 345818
+_su 338923
+une 337555
+_ma 333104
+st_ 326309
+iqu 326117
+ssi 324303
+_se 323582
+dan 315084
+_du 313815
+ui_ 308060
+du_ 307569
+rop 304687
+_il 301411
+nce 298927
+_da 296956
+qui 295162
+un_ 292792
+se_ 289403
+iss 287625
+_mo 287014
+sio 275293
+ux_ 273403
+rs_ 272423
+ell 270731
+pré 270379
+_ré 268909
+air 268587
+ort 267864
+ait 266957
+ais 262723
+_p_ 261401
+ter 260376
+nte 257344
+sur 255536
+ien 254320
+ité 253690
+rai 252784
+iti 251573
+lem 250192
+rés 247711
+nne 247599
+_tr 245712
+_di 244595
+_av 243977
+_fa 243944
+mme 243680
+au_ 240328
+as_ 237497
+_je 235355
+_pe 233840
+mis 228623
+tra 227460
+_eu 225362
+_do 224861
+por 224024
+_vo 223335
+je_ 222856
+pas 221939
+ale 219300
+son 218125
+_ét 218066
+app 213247
+uro 213071
+pos 212344
+_me 210451
+ntr 207363
+int 206860
+ces 206468
+cti 203784
+_to 202530
+ues 201941
+tou 201769
+ir_ 200034
+ure 198003
+out 195850
+ide 195463
+onn 194352
+_pl 193344
+mes 191671
+ain 190411
+ens 189758
+lit 189380
+_a_ 188955
+ten 187767
+tte 187102
+ut_ 183673
+ett 183474
+qu_ 183313
+ect 182969
+és_ 182736
+aut 182699
+enc 182350
+ar_ 181586
+ère 181578
+ame 180905
+sti 179175
+ouv 176745
+end 176603
+mai 176486
+ble 176016
+_ne 174572
+opé 174196
+ive 173697
+urs 173660
+_ex 173603
+mmi 172971
+_ac 172571
+aux 172301
+mon 171031
+_ra 169886
+ie_ 168838
+tat 166909
+tai 165471
+ren 164273
+nsi 163969
+tan 163774
+ser 160896
+onc 160477
+nts 160232
+den 159612
+ieu 159098
+ess 158854
+fai 157194
+ins 156980
+art 155739
+ée_ 155719
+éta 153483
+éen 153207
+sid 153138
+pée 152950
+lus 152916
+ran 152418
+_ca 151401
+sse 151015
+nti 150278
+rat 148060
+_sa 146939
+age 146243
+ési 145932
+anc 145920
+tiq 145591
+si_ 145419
+plu 144176
+sit 143837
+uni 143220
+ven 143180
+nse 142887
+uve 142571
+_si 142171
+oit 142081
+_te 141711
+_on 141313
+pri 139925
+and 139090
+_na 139025
+sen 138794
+cet 138385
+spe 137924
+_fo 137786
+ave 136590
+nde 136548
+tes 134086
+rt_ 132904
+rap 132443
+ine 131921
+ern 131916
+in_ 131707
+ite 131652
+uti 131176
+cer 130506
+ièr 129719
+che 128804
+sou 128395
+ier 128131
+ge_ 128121
+_ch 126640
+ise 125929
+for 125700
+rit 123387
+ppo 122869
+enn 122721
+nta 122701
+ers 122335
+_ai 120781
+rta 120333
+_ap 120235
+vou 119793
+ver 118998
+uel 118469
+tie 118112
+bre 117916
+ond 117755
+eux 116509
+san 116001
+emb 115167
+ois 115022
+pre 114719
+ist 113257
+rti 113108
+abl 111924
+ron 111920
+rem 111851
+tiv 111206
+per 110540
+man 110439
+lan 110413
+_sp 110076
+don 109871
+_id 109641
+_im 109231
+oir 108971
+dre 108608
+sie 108451
+ali 107671
+_n_ 107403
+voi 107368
+ris 107335
+imp 106706
+ava 106422
+omp 105944
+ill 105231
+str 104014
+ssa 102578
+roi 102363
+gra 102029
+ili 101839
+ses 101703
+oli 101668
+leu 101389
+rme 101330
+von 101225
+acc 101154
+avo 100830
+_vi 100789
+ert 100702
+ste 100540
+era 100367
+ès_ 100232
+dem 99560
+fin 98864
+rie 98674
+arl 98555
+_li 98536
+act 98178
+pe_ 98082
+nes 97631
+ées 97456
+teu 96849
+mbr 96634
+ve_ 96619
+pol 96524
+id_ 96511
+_mi 96453
+ord 95767
+ute 95686
+_s_ 95599
+éri 95532
+ass 95305
+_gr 95229
+sem 95058
+eil 94117
+rec 93701
+nom 93624
+cor 93356
+ang 93257
+osi 92945
+nam 92928
+mat 92608
+rd_ 92437
+ker 91959
+rle 91513
+orm 91474
+rte 91428
+pea 91313
+ake 90849
+isa 90734
+mpl 90707
+nst 90649
+eak 90364
+_êt 90030
+oin 89983
+_cr 89501
+ra_ 89326
+nio 89061
+ème 88660
+êtr 88601
+sei 88162
+lis 87781
+dis 87181
+peu 86114
+tés 86018
+itu 85959
+jou 85680
+ica 85566
+cha 85459
+cel 85377
+nat 85296
+dev 85057
+tit 84722
+opo 84635
+emp 84560
+ec_ 84385
+_an 84010
+tur 83988
+nté 83628
+tro 83192
+pen 83078
+_ou 82943
+_c_ 82919
+éra 82765
+éga 82521
+al_ 82245
+vec 82106
+cou 82014
+ici 81883
+uis 81386
+eau 81296
+esp 81130
+uss 81099
+été 81058
+ori 80899
+ls_ 80656
+sta 80393
+_am 80335
+nan 80297
+rou 80279
+ats 80257
+_el 79771
+ani 79629
+utr 79482
+_fi 79444
+min 78904
+mpo 78388
+el_ 77792
+vai 77725
+ndr 77598
+tif 77593
+dir 77591
+ela 76624
+_lo 76574
+lat 76212
+_éc 74508
+ése 74350
+nal 74150
+déc 74086
+nis 73896
+rès 73555
+ina 73469
+sai 72945
+pay 72834
+ime 72436
+nem 72336
+mun 71815
+mem 71287
+nda 71154
+doi 71128
+erm 71113
+der 70742
+met 70464
+ndi 70034
+_as 69883
+spo 69837
+cul 69806
+mmu 69633
+roc 69582
+ays 69543
+fic 69212
+not 69102
+ys_ 68933
+ini 68734
+rer 68547
+_bi 68460
+van 68433
+ifi 68388
+aus 68188
+ail 68162
+_ég 67989
+éci 67851
+soi 67784
+ppe 67638
+cia 67513
+cit 67251
+mer 67191
+erc 67121
+égi 67101
+tic 66963
+ner 66952
+tem 66811
+ema 66810
+fon 66769
+_j_ 66479
+ére 66049
+cat 65979
+_ci 65955
+gal 65479
+mar 65381
+ême 65307
+ita 65255
+_or 65234
+oci 65160
+rav 64966
+gue 64882
+oi_ 64676
+_ob 64484
+ial 64183
+rce 64173
+at_ 64150
+tri 63997
+vis 63740
+lon 63734
+rne 63416
+_ag 63340
+_al 63129
+_ad 63121
+isi 63086
+lie 63024
+vel 62909
+_ju 62880
+ara 62795
+_pu 62719
+_m_ 62615
+att 62553
+dro 62175
+cte 62131
+otr 61990
+ign 61802
+its 61337
+bli 61327
+sat 61180
+eff 61002
+nci 60865
+_ve 60747
+sui 60646
+inc 60380
+_ef 60300
+_él 59349
+nir 59272
+lai 59181
+éco 59129
+ose 59095
+os_ 58985
+ult 58765
+bie 58681
+_mê 58546
+mêm 58436
+squ 58423
+_dr 58373
+omi 58324
+_né 58271
+dit 58243
+arc 58133
+col 58100
+née 58004
+cie 57875
+uer 57856
+uit 57827
+ngu 57223
+ez_ 57204
+erv 57070
+ai_ 57026
+oup 56587
+non 56453
+moi 56389
+ate 56325
+rep 56280
+ura 56264
+ors 56098
+ind 56078
+lor 56002
+ou_ 55968
+bil 55650
+rel 55627
+he_ 55286
+lut 55200
+ona 54933
+_ar 54663
+ctu 54583
+nco 54563
+pli 54514
+_y_ 54460
+tab 54386
+_st 54277
+tér 54064
+qua 54050
+dra 53956
+ral 53747
+tue 53720
+_at 53719
+tal 53596
+dép 53423
+eut 53420
+_af 53418
+eni 53339
+cla 53052
+lic 52896
+_ba 52840
+cco 52444
+ffi 52303
+pér 52188
+elo 52126
+ore 52079
+uct 51954
+dam 51476
+dif 51455
+ote 51378
+ple 50895
+sol 50890
+uri 50850
+vie 50829
+jet 50753
+soc 50571
+rég 50515
+ler 50513
+rch 50490
+ice 50429
+_év 50243
+gen 50196
+pte 50183
+obl 50018
+ono 50014
+ule 49716
+oye 49686
+pon 49624
+pla 49577
+epr 49406
+use 49297
+_ta 49160
+nné 48923
+rog 48627
+aie 48347
+amm 48102
+opp 48058
+som 47797
+exp 47788
+gua 47781
+ann 47780
+icu 47629
+eu_ 47605
+ric 47515
+_sé 47358
+omb 47245
+lar 47048
+uag 47003
+err 46746
+ibl 46682
+nvi 46476
+mbl 46305
+rod 46272
+udr 46170
+cri 46042
+éce 45870
+cis 45810
+reu 45778
+oul 45630
+rob 45504
+poi 45499
+ace 45431
+olu 45236
+éve 45225
+deu 45203
+uli 45156
+ves 45127
+fér 44986
+nau 44973
+arg 44786
+_ab 44767
+_be 44609
+ein 44565
+gne 44371
+iat 44198
+_hu 44058
+ttr 43906
+nfo 43872
+rép 43865
+oll 43837
+ogr 43571
+odu 43535
+dui 43495
+cip 43483
+yen 43470
+pui 43454
+ci_ 43450
+nie 43353
+cep 43300
+uat 43203
+_cl 43163
+fau 43096
+vea 43011
+vot 42878
+sib 42864
+car 42849
+nd_ 42582
+_bo 42427
+trè 42414
+ope 42345
+rma 42324
+ust 42303
+oss 42246
+urr 42201
+loi 42162
+rée 42094
+rna 41951
+auc 41929
+_va 41894
+her 41894
+ppr 41823
+réc 41728
+tin 41548
+exi 41531
+iff 41358
+ujo 41299
+onf 41035
+agi 40758
+ds_ 40569
+upe 40530
+iso 40366
+gle 40292
+nna 40288
+nit 40245
+ard 40205
+ndu 39920
+ils 39863
+env 39776
+vre 39756
+gis 39665
+pec 39587
+_ni 39585
+an_ 39549
+rre 39478
+oud 39423
+réa 39419
+tiè 39391
+cas 39357
+imi 39307
+_bu 39040
+els 39016
+tru 39002
+ubl 38953
+liq 38940
+cur 38831
+rqu 38773
+bat 38657
+lig 38650
+niè 38613
+abo 38571
+nai 38567
+cen 38482
+ies 38481
+idé 38412
+gar 38410
+ché 38405
+seu 38243
+ito 38088
+ger 37971
+emi 37913
+_ho 37778
+tis 37679
+éli 37586
+ssu 37555
+rin 37548
+ffe 37498
+una 37383
+équ 37333
+ept 37330
+lèm 37326
+blè 37325
+éme 37214
+all 37106
+rve 37005
+lib 36934
+_em 36869
+enu 36841
+if_ 36838
+déb 36731
+ora 36699
+vra 36694
+sé_ 36666
+ext 36559
+plo 36534
+evo 36487
+isé 36392
+ret 36374
+_fr 36333
+rni 36312
+bor 36255
+ena 36231
+rci 36130
+vit 36121
+lég 36057
+exe 36012
+dév 35997
+nc_ 35972
+isp 35929
+enf 35756
+rge 35737
+gro 35735
+écu 35572
+édu 35504
+esu 35501
+lop 35466
+déf 35413
+uté 35401
+ume 35349
+foi 35331
+rim 34939
+jus 34912
+_jo 34721
+inf 34681
+bje 34678
+mil 34656
+ivi 34618
+_ti 34504
+_lu 34490
+uvo 34480
+ari 34468
+rio 34452
+uen 34298
+tel 34231
+nel 34203
+eul 34196
+cré 34186
+nge 34183
+obj 34085
+réf 34083
+mie 34061
+dia 34009
+eus 33973
+iel 33927
+tim 33921
+ile 33881
+eco 33810
+rts 33416
+han 33263
+dém 33250
+nve 33241
+cro 33156
+miq 33124
+abi 32985
+evr 32860
+ram 32835
+aur 32824
+nsa 32806
+isc 32746
+adr 32698
+ole 32692
+_ga 32675
+til 32635
+nos 32529
+éné 32506
+_fe 32503
+niq 32462
+rôl 32282
+dér 32150
+mal 32131
+_mé 31907
+rso 31830
+hai 31796
+sso 31784
+néc 31640
+onv 31548
+aqu 31519
+céd 31499
+sée 31411
+ppl 31355
+ré_ 31303
+tec 31258
+_op 31207
+mpr 31180
+urd 31174
+tut 31082
+ôle 30988
+ero 30978
+tée 30911
+édi 30883
+lli 30848
+olo 30754
+ix_ 30553
+dur 30517
+_ri 30401
+fs_ 30371
+éte 30347
+len 30345
+ota 30216
+cho 30116
+tor 30080
+uta 30074
+oma 30064
+rra 30038
+tua 29912
+lim 29839
+bon 29820
+tég 29752
+émo 29702
+tir 29693
+pub 29628
+évi 29594
+rév 29592
+uvr 29582
+uan 29579
+ruc 29486
+fra 29352
+éfi 29255
+nor 29248
+dom 29225
+vir 29220
+épo 29156
+cra 29101
+log 29035
+règ 28982
+duc 28929
+_rè 28912
+pem 28860
+éba 28842
+opt 28806
+hui 28776
+_ha 28735
+aff 28517
+sec 28488
+quo 28472
+ech 28401
+ada 28370
+usi 28280
+sav 28181
+éla 28159
+gie 28116
+lio 28108
+uto 27993
+tag 27983
+_sy 27972
+ègl 27963
+ula 27929
+rêt 27921
+gio 27901
+avi 27895
+_gé 27885
+cun 27866
+ps_ 27848
+éso 27765
+gou 27557
+mit 27519
+aid 27475
+_lé 27422
+mma 27397
+nue 27386
+ets 27376
+pel 27368
+dic 27359
+ifs 27320
+llè 27302
+rot 27295
+nen 27235
+iro 27215
+ges 27131
+cad 27069
+agr 27042
+sus 27037
+osé 27021
+nqu 27009
+heu 26982
+sme 26933
+sa_ 26726
+né_ 26668
+oie 26605
+mpt 26587
+ipe 26500
+sab 26385
+val 26357
+vic 26331
+rri 26224
+auj 26182
+jec 26074
+mod 25982
+ton 25945
+mps 25936
+amé 25934
+git 25933
+lui 25905
+clu 25900
+lèg 25898
+alo 25835
+veu 25821
+_go 25817
+_br 25803
+ior 25770
+occ 25765
+orc 25693
+rvi 25666
+déj 25602
+gan 25544
+nsp 25537
+rab 25526
+har 25511
+réd 25425
+jà_ 25423
+éjà25423
+rib 25394
+toy 25387
+nfi 25383
+urq 25357
+_vu 25353
+ièm 25342
+niv 25324
+ado 25323
+éch 25260
+emm 25257
+rgi 25237
+coo 25233
+séc 25225
+euv 25171
+org 25070
+pti 25062
+_ut 24960
+och 24935
+udg 24926
+bud 24908
+aci 24821
+_oc 24818
+bas 24794
+lée 24769
+nds 24730
+hé_ 24669
+afi 24630
+gén 24624
+ègu 24551
+dop 24502
+_où 24416
+où_ 24416
+_de_ 1519974
+ent_ 1033394
+_la_ 984065
+ion_ 955240
+tion 923279
+ment 774839
+les_ 771032
+que_ 737642
+_le_ 694006
+_et_ 666523
+emen 606126
+_les 577858
+_que 575674
+des_ 571163
+_des 553616
+_con 531070
+ons_ 528476
+atio 472416
+ous_ 446915
+_com 445344
+_par 430258
+_en_ 428011
+_nou 368357
+_pro 354646
+_pou 353657
+comm 342934
+_est 336682
+une_ 325775
+est_ 323834
+tre_ 323777
+nous 321900
+ans_ 319507
+pour 317638
+ique 310504
+ions 302657
+_une 298224
+_du_ 293979
+our_ 284078
+_dan 281641
+res_ 279070
+sion 275056
+dans 271541
+_un_ 271120
+ant_ 270815
+elle 263223
+_il_ 262023
+aire 257426
+_qui 256313
+qui_ 252067
+ire_ 248464
+leme 243310
+_pré 243039
+_ce_ 233480
+ont_ 230198
+_je_ 222744
+port 220215
+_pas 217780
+eur_ 216053
+euro 206946
+_eur 206247
+_sur 202861
+cons 201746
+ait_ 201406
+ité_ 201087
+pas_ 196090
+_au_ 195393
+urop 192101
+ssio 184928
+prés 183273
+_tou 182199
+ais_ 181651
+sur_ 181327
+miss 177497
+lle_ 171383
+nce_ 169279
+aux_ 168346
+mmis 167534
+ommi 167401
+ques 167367
+_ne_ 167149
+_qu_ 163512
+urs_ 162168
+nts_ 160213
+_mon 154427
+par_ 154130
+issi 152702
+omme 151052
+ropé 150228
+ces_ 150189
+opée 149685
+péen 149670
+tiqu 145591
+_tra 144252
+_plu 143967
+iden 140501
+ues_ 139707
+_cet 137164
+dent 136233
+ette 135802
+mes_ 135285
+plus 132889
+_int 132056
+_fai 131170
+tte_ 130938
+ière 129719
+ence 129517
+lus_ 128199
+cont 127903
+_son 127405
+part 127009
+tes_ 126892
+tout 125449
+rési 125405
+tant 124057
+ère_ 123901
+onne 123526
+ésid 123476
+mme_ 123340
+side 122833
+_éta 122596
+rati 121289
+ouve 121231
+eurs 120514
+_mai 120181
+enne 119911
+_rap 119781
+_vou 118725
+nne_ 118725
+ble_ 117446
+ntre 116903
+itio 116377
+_uni 115819
+ter_ 115150
+_sou 114724
+ieur 114562
+cett 113207
+ctio 112893
+ame_ 112871
+ppor 112170
+rapp 110966
+sent 106685
+appo 106660
+_ave 106424
+esti 105707
+onsi 105240
+ents 104593
+ient 104543
+rait 104146
+_aut 104064
+eux_ 103236
+mais 103177
+ontr 102237
+comp 102067
+_ent 101145
+ance 100932
+oit_ 100172
+conc 99986
+_app 99865
+leur 99081
+inte 98992
+age_ 97746
+arti 97544
+able 97491
+ées_ 97450
+parl 97396
+ses_ 97345
+_aux 96513
+prop 96264
+vons 96068
+dre_ 95828
+_acc 95445
+_don 95183
+tive 95018
+mbre 94982
+entr 94719
+ecti 94656
+nes_ 94540
+_id_ 94463
+teur 94232
+enta 93518
+ort_ 92837
+_imp 92835
+siti 92726
+ure_ 92211
+sieu 92025
+ier_ 91979
+_pol 91960
+_spe 91765
+enti 91762
+ker_ 91563
+arle 91415
+posi 91399
+osit 91373
+_nam 90677
+aker 90402
+spea 90373
+name 90366
+peak 90346
+eake 90343
+ente 90269
+_per 89004
+itiq 88994
+nion 88832
+être 88569
+_êtr 88117
+éenn 87916
+poli 87646
+ois_ 87078
+ens_ 86714
+ale_ 86486
+tés_ 86001
+sont 85401
+_peu 85195
+liti 85125
+vent 84949
+olit 84658
+_dev 84385
+ien_ 84127
+nter 83191
+onse 83159
+lité 82443
+avec 81801
+vec_ 81801
+ropo 81631
+unio 81444
+rlem 80591
+tair 80568
+oir_ 79611
+oute 79589
+mons 79533
+ats_ 79194
+_pri 78253
+out_ 77743
+_ces 77682
+fait 77000
+_cel 76903
+état 76812
+ires 76714
+_se_ 76700
+quel 76695
+opos 76514
+rais 76466
+voir 76436
+été_ 75343
+utio 75326
+nsie 75182
+utre 74923
+_res 74562
+_ell 74497
+_ser 74421
+_pos 74320
+nte_ 74080
+ussi 73760
+_dir 73642
+rès_ 73528
+lles 73424
+rése 73187
+_pre 73062
+form 72896
+mati 72625
+_pay 72342
+_dis 71695
+_déc 71580
+aine 71468
+_ont 70984
+dire 70149
+neme 70013
+stio 69758
+mmun 69524
+pays 69344
+vous 68752
+ays_ 68737
+autr 68633
+ommu 68539
+_not 68369
+nati 68132
+_avo 68008
+nsei 67970
+impo 67964
+_doi 67900
+ive_ 67480
+main 67362
+lati 67317
+ture 66888
+son_ 66765
+_éga 66327
+ncer 66312
+alem 66248
+proc 65838
+ande 65734
+once 65602
+rité 65582
+eil_ 65452
+_on_ 65324
+ins_ 65221
+seil 65043
+_act 64904
+_mes 64617
+tats 64590
+_été 64357
+jour 64355
+embr 63878
+ille 63699
+ine_ 63644
+tent 63567
+nde_ 63133
+mpor 63014
+orte 62937
+isse 62480
+rer_ 62380
+uest 62150
+fair 61932
+otre 61843
+ers_ 61562
+ite_ 61375
+égal 61246
+its_ 61045
+_ins 60829
+orta 60526
+reme 60484
+_eff 60255
+_si_ 60088
+issa 59775
+ser_ 59303
+ésen 59214
+endr 58892
+sant 58784
+avai 58633
+ise_ 58590
+rtan 58547
+_leu 58454
+erne 58447
+tati 58446
+même 58436
+_mêm 58242
+nir_ 58157
+_lan 58141
+ndre 57655
+ense 57341
+sati 57336
+ème_ 57205
+ains 57020
+amen 56857
+roit 56502
+_fon 56434
+cess 56172
+uell 56029
+_cha 55801
+auss 55770
+bien 55643
+ssi_ 55000
+trai 54907
+_dro 54835
+ilit 54821
+ctiv 54765
+ssai 54749
+memb 54729
+_mem 54712
+_aus 54652
+_rés 54548
+rtic 54372
+pris 53957
+cati 53814
+cert 53747
+trav 53323
+_bie 52976
+gale 52958
+ême_ 52946
+droi 52842
+titu 52789
+lang 52773
+mett 52701
+_soi 52548
+tran 52397
+acco 52313
+_ou_ 52258
+_ass 51889
+iste 51887
+tres 51830
+erai 51715
+icat 51555
+_mar 51552
+_cer 51526
+ress 51324
+nten 51222
+ours 51173
+enir 51053
+ste_ 50946
+_tro 50847
+mand 50845
+vant 50832
+avon 50766
+iona 50743
+angu 50669
+eut_ 50552
+_san 50466
+_att 50259
+lors 50044
+sair 50021
+mmen 50017
+soci 49811
+bres 49773
+rava 49633
+_for 49517
+_nom 49442
+uver 49434
+_fin 49253
+bili 49171
+repr 49129
+essi 48936
+erme 48911
+notr 48904
+_gra 48861
+_rec 48836
+éen_ 48668
+pens 48655
+onst 48618
+ures 48486
+tain 48384
+_éco 48316
+_rég 48107
+isat 48026
+che_ 47970
+ales 47847
+nouv 47818
+étai 47596
+cern 47582
+icul 47551
+rise 47551
+_moi 47521
+_exp 47483
+ner_ 47417
+ela_ 47403
+era_ 47363
+ront 47358
+empl 47153
+deme 47093
+uage 46998
+ités 46937
+rend 46889
+_dép 46821
+somm 46813
+erta 46795
+cela 46792
+cour 46691
+ngua 46680
+guag 46627
+ntio 46592
+ante 46579
+amme 46479
+mmes 46438
+ionn 46412
+uis_ 46254
+_dem 46149
+rtai 46136
+ocia 45929
+inté 45843
+_ava 45660
+érie 45652
+sure 45446
+_sui 45395
+stit 45342
+enco 45154
+embl 45084
+cord 45064
+peut 44988
+bre_ 44985
+_ind 44615
+ssem 44601
+ccor 44591
+acti 44506
+ible 44487
+ord_ 44422
+prob 44253
+fond 44236
+nant 44150
+semb 44054
+resp 44037
+ler_ 43827
+seme 43815
+fin_ 43645
+_enc 43611
+tien 43542
+nsti 43429
+ants 43388
+eau_ 43369
+eure 43324
+rect 43301
+vail 43250
+oyen 43224
+dema 43223
+_soc 43215
+ende 43151
+nfor 43057
+éren 43019
+veau 43011
+rodu 43008
+_vot 42768
+_qua 42685
+renc 42437
+_trè 42411
+très 42385
+_poi 42268
+sera 42204
+_ren 42203
+uer_ 42164
+tabl 42133
+nces 42042
+rans 42014
+rent 41994
+alis 41969
+bles 41961
+écon 41734
+inst 41703
+nomi 41657
+tous 41645
+_fau 41488
+doit 41368
+ujou 41289
+_deu 41269
+deux 41155
+onal 40902
+eman 40898
+oint 40876
+_man 40840
+conf 40818
+puis 40807
+_cou 40709
+onom 40672
+ope_ 40662
+rope 40591
+esse 40568
+rogr 40503
+sse_ 40473
+gran 40416
+fére 40389
+drai 40388
+dame 40362
+rois 40348
+écis 40323
+prog 40298
+serv 40218
+pren 40152
+avan 40105
+pers 40005
+ativ 39954
+ndem 39883
+_col 39875
+udra 39851
+ils_ 39826
+_pen 39786
+orme 39722
+rand 39539
+robl 39347
+_pla 39225
+pect 39094
+spec 39094
+_nat 39074
+erna 38993
+liqu 38939
+aien 38810
+tièr 38797
+ecte 38752
+cono 38732
+asse 38680
+poin 38567
+cher 38452
+aut_ 38441
+nièr 38380
+_ame 38225
+irec 38217
+oudr 38135
+sque 38096
+diff 38059
+alit 37998
+ors_ 37896
+pose 37865
+ies_ 37815
+onna 37788
+_ter 37442
+ison 37441
+cial 37418
+_car 37365
+lème 37326
+blèm 37325
+oblè 37300
+avoi 37285
+isio 37284
+_dif 36950
+stru 36849
+llem 36822
+_déb 36728
+els_ 36623
+ettr 36615
+_rem 36528
+sonn 36521
+ntes 36447
+_esp 36351
+nse_ 36344
+érat 36339
+_ann 36319
+mend 36272
+nale 36257
+teme 36256
+ves_ 36247
+solu 36144
+coll 36110
+prod 36057
+appr 36049
+_rép 36046
+_dév 35938
+luti 35859
+_env 35788
+donn 35778
+nnée 35758
+ossi 35695
+iter 35655
+déci 35636
+_lor 35633
+vers 35541
+nnes 35482
+merc 35449
+esur 35438
+ntra 35433
+mesu 35393
+jet_ 35331
+atte 35302
+disp 35237
+ubli 35152
+_rep 35101
+_rel 35099
+velo 35065
+_voi 35050
+elop 35043
+lopp 35006
+aill 35004
+rouv 34950
+ore_ 34860
+perm 34854
+_déf 34837
+der_ 34738
+insi 34695
+déve 34673
+fois 34632
+fica 34629
+poss 34587
+non_ 34536
+_inf 34516
+ouvo 34455
+ével 34393
+émen 34382
+fina 34353
+mple 34308
+faut 34299
+pouv 34270
+_ils 34206
+mani 34206
+ntie 34192
+erci 34160
+iati 34119
+obje 34084
+_obj 34081
+_mat 34080
+ères 34079
+rant 34077
+ssib 34065
+rce_ 34045
+arch 33939
+ntér 33936
+tend 33879
+ises 33804
+régi 33760
+_gro 33730
+voud 33679
+olut 33671
+oupe 33579
+ace_ 33488
+ute_ 33383
+onc_ 33371
+donc 33367
+orma 33317
+rts_ 33274
+tif_ 33238
+_ai_ 33183
+_non 33178
+_agi 33169
+euse 33136
+essa 33135
+ffic 33125
+miqu 33124
+ttre 33065
+roup 32987
+marc 32986
+atiq 32838
+ncor 32788
+oppe 32709
+_seu 32666
+int_ 32646
+abor 32613
+remi 32516
+ssan 32486
+niqu 32462
+_exi 32364
+cept 32322
+enda 32308
+inci 32305
+_emp 32304
+éces 32291
+rte_ 32280
+uati 32259
+iale 32212
+devo 32179
+aite 32178
+_som 32121
+grou 32108
+_jus 32067
+cent 32065
+cteu 32065
+unau 32016
+devr 31969
+aiso 31895
+orit 31869
+core 31850
+ombr 31838
+rme_ 31800
+ines 31797
+nos_ 31727
+lair 31694
+rson 31679
+erso 31678
+adre 31626
+_néc 31615
+ssen 31612
+néce 31610
+conv 31500
+naut 31484
+ail_ 31407
+prem 31351
+muna 31317
+seul 31298
+effe 31297
+cond 31239
+ice_ 31016
+ogra 30937
+rôle 30810
+_nos 30728
+nomb 30712
+_dém 30672
+rons 30638
+ourr 30637
+_jou 30613
+_exe 30576
+ateu 30571
+veni 30570
+sans 30564
+nnel 30450
+tuel 30424
+ain_ 30405
+ctif 30403
+vien 30396
+vrai 30377
+ntai 30368
+_cla 30151
+nanc 30113
+sout 30101
+soit 30097
+inan 30090
+_réf 30089
+ndan 30065
+oits 30019
+pons 29941
+rieu 29914
+vre_ 29693
+tie_ 29678
+aque 29667
+lleu 29659
+ucti 29615
+publ 29603
+eron 29574
+rien 29568
+rmet 29554
+omiq 29298
+dont 29282
+_cas 29247
+cult 29147
+iers 29119
+ondi 29088
+yens 29034
+imen 28980
+anti 28920
+mble 28913
+_règ 28912
+envi 28860
+peme 28858
+tern 28827
+ourd 28824
+ppro 28822
+préc 28779
+_hui 28743
+_cit 28690
+ives 28690
+stan 28681
+ticu 28670
+déba 28623
+tten 28604
+evon 28485
+_dom 28433
+util 28384
+_tel 28376
+appe 28319
+_mis 28314
+_sec 28311
+sibl 28283
+ose_ 28233
+conn 28097
+prin 28095
+pend 28089
+dern 28087
+ramm 28082
+_sit 28078
+gram 28058
+nnem 28015
+rne_ 27993
+cisi 27992
+art_ 27963
+ègle 27963
+règl 27958
+ébat 27956
+_vis 27954
+née_ 27853
+_ain 27843
+reco 27817
+ange 27805
+term 27781
+rché 27737
+éral 27695
+ger_ 27685
+nsi_ 27678
+culi 27677
+_sav 27658
+gion 27561
+sons 27544
+rmat 27489
+lier 27462
+temp 27455
+ruct 27427
+igne 27400
+dant 27378
+téri 27378
+oins 27354
+ets_ 27336
+isan 27328
+erni 27327
+ifs_ 27315
+cas_ 27280
+pres 27268
+_ten 27262
+atiè 27207
+rinc 27202
+ncip 27171
+_ses 27132
+situ 27124
+chan 27113
+_cri 27087
+duit 27063
+upe_ 27037
+nsta 27013
+ppem 27006
+_lib 26924
+_aff 26902
+ctue 26872
+_mil 26857
+terr 26845
+truc 26833
+_cro 26823
+eule 26819
+ploi 26817
+lisa 26807
+itua 26776
+_lég 26774
+_der 26761
+eill 26757
+_me_ 26724
+uvel 26683
+abil 26662
+urd_ 26636
+_rai 26605
+ppel 26530
+_cré 26458
+posé 26457
+rela 26455
+auta 26450
+égio 26374
+_str 26371
+itut 26340
+_cad 26312
+odui 26310
+anné 26231
+nées 26229
+_pub 26219
+hui_ 26196
+aujo 26181
+_auj 26180
+tat_ 26171
+uel_ 26156
+nté_ 26110
+ject 26074
+ispo 26068
+aide 26049
+aiss 26038
+_aur 26001
+gue_ 25992
+_ver 25991
+tale 25979
+_réa 25954
+iron 25932
+ntat 25877
+_bon 25870
+para 25859
+ilis 25840
+rest 25802
+omma 25798
+cadr 25796
+cito 25761
+espo 25757
+auto 25749
+mps_ 25723
+appl 25722
+heur 25679
+anis 25653
+_pui 25621
+_déj 25602
+spon 25593
+bjec 25577
+tuti 25540
+rtie 25512
+moin 25487
+_aid 25468
+cer_ 25451
+lui_ 25442
+déjà25423
+éjà_ 25423
+tuat 25415
+ôle_ 25403
+_cho 25381
+démo 25354
+urqu 25346
+glem 25344
+ième 25342
+vern 25316
+llèg 25254
+_mod 25236
+ompt 25204
+gouv 25197
+orts 25179
+mon_ 25165
+ntal 25138
+cet_ 25137
+pass 25136
+ollè 25133
+nive 25132
+ompr 25098
+prot 25092
+itoy 25072
+nsid 25058
+onti 25013
+toye 24988
+erve 24987
+emps 24937
+emme 24884
+_bud 24858
+tifs 24838
+sécu 24805
+budg 24791
+elat 24778
+_min 24760
+ple_ 24750
+péra 24740
+_uti 24706
+rale 24706
+mis_ 24704
+nds_ 24689
+curi 24645
+ide_ 24629
+croi 24614
+ché_ 24598
+mond 24591
+cell 24585
+oire 24570
+iven 24565
+ègue 24551
+lègu 24550
+doma 24538
+rmes 24522
+just 24508
+rnem 24506
+tanc 24493
+omai 24481
+spos 24477
+_où_ 24416
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/es.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/es.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/es.ngp (working copy)
@@ -1,1002 +1,3060 @@
-# NgramProfile generated at Sat Sep 25 16:07:06 EEST 2004 for Nutch Language Identification
-ngram_count 19291375
-_ 1229126
-e 901651
-a 722542
-o 566893
-s 510884
-n 474533
-r 434016
-i 427524
-l 332649
-d 321783
-t 308628
-c 301440
-u 256083
-e_ 248908
-s_ 236261
-a_ 214774
-m 197317
-p 197241
-o_ 176465
-de 164329
-n_ 151431
-en 149511
-es 149116
-os 115116
-la 109408
-os_ 104428
-re 88950
-nt 88702
-ci 86550
-ue 86439
-er 85025
-ar 82816
-co 80597
-b 79298
-te 78755
-as 75646
-ta 75057
-l_ 74503
-ra 74195
-on 72650
-r_ 71389
-st 66049
-q 64912
-qu 64851
-el 63515
-g 62653
-al 62628
-or 61903
-as_ 58608
-se 57348
-ó 55891
-que 55727
-ad 55692
-ro 55554
-do 54564
-an 54169
-ent 53516
-ue_ 52824
-to 52746
-y 51629
-v 51184
-lo 49082
-un 48952
-es_ 48648
-f 47525
-ón 47384
-ac 46965
-ón_ 46841
-h 46829
-ió 46752
-si 46694
-me 46592
-ión 46068
-ión_ 46058
-da 46041
-in 45402
-po 45226
-pr 43361
-ti 43195
-est 43016
-nte 42192
-ec 40486
-na 39489
-ic 39031
-te_ 38679
-pa 37709
-con 37552
-ca 37162
-no 36680
-id 36604
-io 36572
-am 36021
-tr 35774
-ri 35303
-ie 35107
-mi 34969
-do_ 34887
-le 33581
-ne 33428
-mo 32742
-ia 32637
-pe 32298
-is 32252
-om 31461
-Ã 30950
-di 30069
-aci 29282
-em 29276
-los 28792
-ció 28717
-ción 28581
-to_ 28469
-so 28066
-ma 27833
-ra_ 27785
-res 27200
-men 26416
-nte_ 26079
-nc 25813
-ar_ 25118
-ado 25045
-ente 24911
-com 24457
-nd 24108
-ha 23923
-li 23817
-sta 23713
-par 23570
-ni 23470
-á 23345
-ce 22907
-or_ 22897
-ment 22727
-cu 21984
-ur 21912
-sa 21571
-por 20662
-las 19623
-j 19058
-op 18876
-ació 18874
-pro 18796
-nto 18516
-su 18372
-at 18281
-im 18236
-pre 18216
-tra 18215
-ien 18096
-ta_ 18069
-cia 18041
-ns 17988
-el_ 17941
-mp 17927
-it 17839
-ion 17727
-z 17686
-ol 17253
-ida 17065
-ab 17050
-ed 17021
-ct 17011
-esta 16860
-nci 16820
-rt 16803
-na_ 16727
-ica 16596
-cio 16590
-mos 16275
-one 16217
-eg 16216
-del 15972
-bi 15928
-mos_ 15758
-dad 15624
-ob 15491
-ara 15370
-br 15242
-od 14928
-ir 14900
-mb 14851
-é 14800
-ia_ 14765
-pu 14759
-una 14753
-nto_ 14623
-ado_ 14584
-ant 14486
-ame 14275
-nes 14249
-va 14211
-al_ 14089
-er_ 14052
-nes_ 13978
-oc 13941
-dos 13906
-rec 13848
-amen 13824
-d_ 13750
-rop 13745
-gu 13732
-sp 13546
-iv 13510
-rm 13480
-on_ 13476
-ea 13413
-an_ 13266
-nta 13173
-cion 13142
-ve 13136
-fi 13093
-tu 13045
-ro_ 13032
-en_ 12962
-da_ 12863
-ues 12709
-dos_ 12657
-Ãa 12591
-ones 12589
-era 12502
-des 12455
-ch 12448
-ba 12285
-per 12285
-ento 12254
-bl 12222
-uc 11966
-ga 11957
-para 11941
-re_ 11905
-ste 11899
-ara_ 11847
-ione 11785
-ñ 11762
-mis 11726
-ho 11702
-ten 11678
-vi 11631
-uest 11489
-ter 11476
-enc 11340
-ad_ 11237
-pl 11219
-idad 11179
-tar 11116
-isi 11113
-et 11064
-pres 10966
-x 10965
-ici 10928
-gr 10837
-ui 10792
-les 10770
-uro 10756
-sió 10697
-pue 10688
-sión 10688
-us 10624
-tad 10621
-la_ 10605
-ua 10599
-dad_ 10487
-mu 10456
-be 10377
-ala 10360
-fo 10280
-mo_ 10163
-io_ 10146
-vo 10105
-str 10101
-eu 10099
-za 10045
-les_ 10003
-ot 9959
-ons 9952
-nos 9905
-enci 9840
-ada 9839
-ari 9831
-eb 9794
-enta 9750
-tos 9746
-ap 9735
-il 9734
-ncia 9683
-ido 9642
-tos_ 9635
-ante 9630
-omi 9593
-eur 9560
-tiv 9560
-euro 9513
-ntr 9498
-esp 9477
-ect 9362
-tic 9322
-ero 9214
-lu 9212
-den 9206
-emo 9181
-ere 9157
-lo_ 9155
-tan 9147
-sta_ 9109
-ll 9062
-ier 9049
-Ãa_ 8957
-ex 8949
-rà 8944
-ño 8916
-cons 8906
-tam 8818
-urop 8811
-orm 8810
-comi 8752
-rio 8749
-omis 8739
-ient 8737
-ul 8664
-bre 8656
-esi 8656
-sid 8627
-ca_ 8595
-ale 8577
-ig 8575
-ndo 8536
-mie 8477
-ist 8448
-nu 8426
-de_ 8362
-cia_ 8348
-der 8325
-tado 8325
-ide 8288
-for 8259
-eci 8249
-sti 8242
-ble 8210
-ona 8202
-ene 8196
-emos 8098
-esa 8081
-ran 8077
-isió 8052
-ib 7959
-cr 7944
-end 7934
-ope 7923
-uni 7910
-tro 7898
-go 7891
-ont 7887
-deb 7873
-rr 7789
-ros 7787
-mbi 7751
-ados 7749
-sto 7662
-fe 7660
-ya 7593
-cho 7529
-amb 7491
-form 7423
-rá 7403
-ido_ 7393
-ese 7364
-bre_ 7346
-ej 7339
-ev 7284
-má 7272
-int 7253
-eñ 7252
-ina 7227
-ndo_ 7225
-eo 7220
-nf 7210
-ero_ 7190
-misi 7175
-acio 7171
-ales 7161
-ás 7151
-ste_ 7127
-i_ 7084
-no_ 7083
-das 7081
-das_ 7069
-rc 7044
-rÃa 7030
-cont 7017
-ye 7017
-y_ 6972
-ud 6951
-ica_ 6921
-art 6917
-ros_ 6889
-gra 6882
-cto 6867
-tes 6857
-rs 6842
-so_ 6832
-ef 6827
-rope 6821
-ay 6773
-spe 6704
-ma_ 6692
-nos_ 6685
-edi 6656
-ir_ 6650
-ás_ 6644
-ambi 6607
-rl 6607
-pi 6604
-ú 6537
-iz 6531
-du 6520
-tes_ 6510
-jo 6478
-señ 6470
-más 6441
-co_ 6418
-tod 6398
-omo 6384
-rd 6380
-ora 6359
-gi 6345
-pues 6341
-res_ 6325
-lam 6322
-ece 6312
-ser 6290
-ita 6283
-ea_ 6280
-um 6269
-ria 6261
-qui 6227
-esto 6225
-sar 6206
-he 6184
-inte 6133
-lar 6121
-side 6114
-obr 6095
-cue 6081
-ade 6077
-eño 6050
-iva 6034
-estr 6025
-amo 6012
-este 5980
-mien 5979
-nue 5959
-fu 5954
-ali 5935
-lt 5935
-se_ 5933
-fic 5924
-obre 5872
-omo_ 5841
-nal 5839
-rta 5836
-los_ 5833
-au 5805
-como 5798
-egu 5791
-ru 5781
-ech 5761
-amos 5755
-seño 5751
-iona 5749
-iza 5731
-eri 5730
-eñor 5723
-ñor 5723
-dent 5702
-u_ 5700
-ort 5694
-rac 5692
-ico 5689
-resi 5677
-dic 5667
-ces 5663
-pon 5640
-esid 5633
-iden 5620
-á_ 5620
-odo 5610
-sob 5607
-ren 5603
-and 5589
-emp 5523
-ge 5523
-sobr 5522
-ace 5499
-rma 5485
-lame 5481
-ner 5478
-rg 5462
-ebe 5448
-cl 5430
-nter 5418
-mpl 5411
-ios 5407
-ura 5405
-ial 5354
-ntes 5343
-cer 5337
-if 5336
-debe 5334
-up 5332
-espe 5309
-je 5300
-part 5292
-ario 5236
-inc 5236
-ada_ 5231
-raci 5224
-ut 5222
-uer 5220
-man 5215
-sen 5211
-unt 5206
-eo_ 5197
-tant 5181
-tas 5168
-ras 5158
-tal 5158
-cas 5154
-mer 5148
-cie 5130
-imp 5117
-cc 5109
-én 5081
-arl 5078
-tiva 5057
-mpo 5051
-nda 5030
-dec 5018
-ema 5012
-là 5009
-tica 4999
-ep 4980
-resp 4977
-ili 4972
-ié 4972
-ios_ 4969
-reg 4968
-tas_ 4954
-lic 4876
-pos 4860
-era_ 4850
-sc 4841
-ecto 4832
-ati 4826
-port 4823
-rn 4790
-lid 4782
-tar_ 4769
-go_ 4762
-rÃa_ 4746
-tur 4735
-Ãt 4709
-ate 4705
-uci 4702
-med 4693
-omp 4690
-prop 4681
-entr 4663
-comp 4639
-én_ 4638
-ién 4631
-que_ 4583
-cci 4569
-lida 4569
-anc 4568
-cre 4552
-gun 4544
-oy 4540
-abl 4532
-nfo 4529
-va_ 4524
-rla 4516
-tor 4512
-echo 4500
-medi 4491
-ued 4491
-inf 4486
-min 4483
-mbr 4479
-ién_ 4469
-pec 4452
-sto_ 4446
-imi 4425
-le_ 4421
-orma 4414
-car 4406
-todo 4395
-ip 4390
-pri 4389
-ontr 4379
-bié 4365
-nió 4365
-rio_ 4361
-nión 4356
-eso 4355
-rar 4352
-nse 4338
-jo_ 4336
-llo 4335
-ag 4322
-ore 4322
-rme 4321
-tamb 4321
-bién 4317
-mbié 4314
-yl 4309
-spec 4308
-iem 4305
-alo 4304
-nde 4304
-nti 4303
-seg 4296
-nfor 4294
-ede 4293
-cial 4290
-ntra 4289
-Ãti 4288
-cul 4283
-pol 4276
-ras_ 4272
-rad 4258
-rat 4258
-yo 4253
-rea 4240
-cua 4237
-ral 4227
-ber 4225
-sin 4202
-oci 4201
-dem 4197
-ho_ 4169
-ivo 4168
-cho_ 4158
-ejo 4157
-arla 4136
-ust 4130
-cti 4120
-emb 4112
-ver 4101
-eco 4100
-esti 4095
-erc 4092
-ual 4083
-Ãtic 4079
-cad 4066
-ng 4052
-tie 4051
-des_ 4048
-las_ 4047
-fr 4037
-xi 4031
-esar 4029
-mas 4028
-añ 4017
-ias 4006
-ndi 3986
-otr 3974
-ce_ 3968
-hac 3960
-me_ 3960
-ias_ 3956
-yd 3953
-og 3950
-bie 3949
-rte 3940
-ria_ 3939
-ert 3938
-osi 3935
-onse 3929
-uen 3928
-ores 3902
-are 3901
-pea 3898
-cos 3884
-segu 3878
-onal 3876
-opea 3876
-olà 3870
-itu 3867
-lÃt 3862
-lÃti 3862
-ano 3861
-polà 3858
-olÃt 3855
-uy 3855
-án 3853
-parl 3845
-ju 3841
-rlam 3840
-ond 3830
-uie 3829
-gar 3820
-info 3815
-vo_ 3815
-stad 3814
-ses 3796
-tivo 3790
-pero 3778
-av 3772
-act 3761
-tra_ 3759
-Ãs 3758
-lan 3753
-ela 3738
-sm 3737
-sa_ 3723
-posi 3720
-stra 3701
-ando 3696
-bo 3695
-iend 3684
-leg 3684
-uda 3682
-able 3671
-nues 3668
-nic 3664
-tre 3662
-son 3648
-und 3647
-Ã_ 3647
-sent 3645
-fa 3642
-ome 3637
-pli 3635
-pued 3630
-nst 3629
-aj 3620
-ers 3619
-tem 3608
-tá 3607
-fin 3594
-yde 3590
-unió 3583
-icio 3576
-dis 3574
-mun 3572
-nsi 3564
-sol 3562
-spo 3562
-mar 3555
-ico_ 3548
-iva_ 3542
-aba 3532
-gen 3526
-ñor_ 3526
-ini 3502
-ori 3490
-orta 3479
-ata 3476
-pea_ 3459
-rese 3450
-aria 3449
-bu 3433
-ern 3428
-nac 3427
-rti 3426
-ven 3417
-deci 3408
-aà 3404
-mas_ 3400
-unto 3389
-orme 3388
-ism 3368
-rech 3366
-rá_ 3358
-dir 3340
-tari 3324
-fica 3323
-ntos 3320
-in_ 3317
-cció 3313
-esen 3303
-rme_ 3284
-lac 3283
-nid 3274
-ativ 3272
-ami 3264
-az 3260
-ses_ 3260
-ble_ 3257
-trat 3254
-ram 3248
-cha 3246
-nta_ 3245
-hace 3242
-ult 3241
-odo_ 3239
-naci 3238
-lm 3236
-fer 3233
-ún 3233
-ne_ 3229
-nv 3218
-uch 3216
-ime 3214
-duc 3206
-cto_ 3203
-aÃs 3191
-anci 3186
-sr 3181
-ref 3180
-paà 3177
-paÃs 3177
-alos 3173
-egi 3164
-iste 3161
-erec 3151
-mpr 3151
-ito 3147
-did 3144
-lem 3142
-impo 3138
-dere 3135
-eces 3129
-hos 3128
-tri 3124
-lg 3123
-ora_ 3119
-sos 3118
-laci 3115
-liz 3114
-eda 3111
-ula 3098
-quie 3097
-tua 3093
-tura 3093
-ifi 3092
-alm 3090
-pla 3086
-ens 3079
-sit 3076
-pod 3075
-ctiv 3073
-chos 3072
-rol 3071
-nas 3064
-lme 3051
-teri 3051
-liza 3050
-ele 3045
-stá 3045
-rob 3044
-lmen 3043
-rv 3040
-hos_ 3033
-nas_ 3032
-tros 3029
-erd 3021
-ener 3014
-ial_ 3006
-nad 3003
-nal_ 2995
-sus 2988
-onc 2986
-rid 2986
-ez 2985
-tac 2982
-prob 2980
-alme 2975
-pone 2965
-stas 2962
-po_ 2953
-tro_ 2948
-cer_ 2937
-iene 2935
-ja 2934
-llo_ 2934
-hay 2931
-ino 2927
-peo 2926
-nec 2913
-rse 2912
-yla 2905
-alg 2904
-sari 2903
-está 2902
-ades 2900
-cac 2899
-erv 2887
-mpor 2879
-eme 2876
-af 2873
-ete 2870
-dar 2864
-itar 2861
-ota 2854
-ug 2851
-ple 2848
-rte_ 2847
-can 2846
-bil 2844
-nece 2842
-eti 2833
-ani 2830
-obl 2829
-ae 2827
-ific 2825
-és 2815
-opeo 2805
-mit 2792
-oce 2792
-bro 2790
-sos_ 2787
-é_ 2786
-dade 2785
-han 2775
-ntar 2775
-opu 2767
-smo 2766
-embr 2755
-anos 2752
-z_ 2749
-zar 2749
-rim 2746
-tien 2746
-reci 2740
-rab 2736
-rro 2736
-ecu 2731
-err 2724
-imo 2724
-iemb 2721
-pect 2721
-arr 2720
-rse_ 2717
-soc 2713
-rar_ 2709
-arti 2707
-eren 2707
-ismo 2705
-roc 2704
-cam 2703
-cla 2697
-pt 2692
-lica 2683
-soci 2681
-eno 2680
-ega 2677
-ell 2677
-tid 2674
-hab 2673
-dam 2666
-caci 2661
-cir 2660
-aso 2654
-cid 2642
-ctu 2640
-ins 2639
-zo 2631
-uier 2628
-án_ 2620
-sis 2617
-taci 2610
-dr 2608
-nen 2597
-rata 2596
-stro 2596
-baj 2594
-col 2593
-conc 2592
-eni 2592
-otro 2589
-rtan 2589
-bili 2580
-efe 2575
-ropu 2573
-erm 2567
-econ 2561
-tene 2560
-cor 2558
-olu 2547
-omu 2546
-cos_ 2543
-ric 2542
-uede 2541
-ejo_ 2540
-ña 2540
-eva 2539
-efi 2534
-emen 2533
-asa 2529
-nsej 2529
-sej 2529
-exi 2525
-luc 2523
-icac 2522
-nsa 2521
-imie 2519
-ocia 2519
-opue 2517
-fun 2516
+# NgramProfile generated at Tue May 31 01:40:27 CEST 2005 for Nutch Language Identification
+e 19510647
+a 15552161
+o 11994901
+s 10951363
+n 10264168
+r 9338733
+i 9231634
+l 7157354
+d 6954208
+t 6630579
+c 6389062
+u 5488525
+p 4619765
+m 4293435
+b 1691873
+g 1397561
+q 1347574
+ó 1170737
+y 1090496
+v 1089846
+f 1010634
+h 996904
+à638446
+á 487795
+j 431745
+z 381061
+é 345200
+ñ 239155
+x 238768
+k 144717
+ú 143093
+w 21234
+º 6228
+à6222
+ö 5739
+è 5236
+ü 4405
+ê 2232
+ä 1875
+ç 739
+ô 644
+æ 626
+ò 415
+î 334
+û 316
+ù 260
+â 242
+ã 234
+ø 226
+ß 219
+ª 216
+ï 135
+Ã¥ 105
+ë 52
+ì 45
+õ 4
+ý 4
+µ 2
+ð 1
+e_ 5450033
+a_ 5114432
+s_ 4971348
+o_ 3783806
+_e 3585680
+de 3495481
+_d 3346210
+n_ 3220021
+en 3180461
+es 3177642
+_p 2847729
+_l 2763689
+os 2347518
+la 2343676
+_c 2126988
+_a 2047924
+_s 1945740
+re 1880451
+nt 1880051
+er 1862728
+ue 1824191
+ci 1822278
+ar 1730173
+co 1711565
+te 1678847
+l_ 1631920
+r_ 1627711
+ra 1585237
+on 1581028
+as 1579469
+ta 1570661
+st 1410169
+el 1398533
+qu 1343822
+or 1326022
+se 1223233
+an 1179972
+ro 1179394
+do 1174449
+_q 1162178
+ad 1161821
+to 1126818
+me 1080741
+al 1062681
+_m 1052303
+un 1038393
+si 1021135
+lo 1013493
+ón 992201
+ió 979832
+in 974816
+ac 973129
+po 965354
+da 959744
+pr 947933
+ti 928372
+na 925489
+id 891588
+_t 884224
+_n 864541
+ec 840213
+ic 828510
+y_ 819447
+pa 812981
+am 804248
+pe 788255
+ca 781601
+io 770745
+_i 766205
+tr 761868
+_u 752093
+_y 747911
+ri 747796
+no 744115
+mi 743716
+le 740892
+ie 735902
+ne 715036
+_r 713163
+ia 701346
+is 692803
+mo 690221
+om 659076
+_h 633855
+di 631648
+em 626871
+so 601926
+ma 595890
+nc 542775
+ni 521176
+nd 520812
+li 511426
+ha 507497
+ce 493064
+ur 479726
+cu 460397
+sa 451167
+_f 430290
+ns 413260
+op 401383
+_o 397588
+su 396265
+it 393211
+d_ 392598
+im 392334
+mp 390531
+ea 373465
+sp 369686
+ab 363469
+ed 361622
+at 361109
+rt 356913
+ct 355547
+ol 353991
+br 336213
+eg 333328
+_v 331190
+ob 326997
+ir 323848
+pu 320051
+bi 319601
+gu 313092
+od 307503
+mb 307435
+rm 298698
+va 298429
+tu 284781
+ve 283720
+oc 283522
+fi 279677
+iv 279138
+ba 271942
+bl 267898
+p_ 266845
+ga 262283
+ch 258135
+uc 257663
+ua 253361
+_g 252964
+ÃÂa 251137
+vi 241250
+us 240389
+pl 237338
+gr 234100
+ho 234061
+et 229193
+eu 228609
+ui 227503
+mu 220382
+fo 216984
+vo 214993
+_b 212977
+il 212486
+be 211738
+ot 210955
+za 207364
+eb 200790
+ll 200136
+lu 199293
+ex 196210
+ap 190668
+ig 190104
+ul 185983
+ño 179264
+cr 178715
+rà177520
+nu 174119
+ib 172123
+go 168535
+ej 165047
+nf 161052
+eo 159026
+i_ 158917
+rr 156919
+rá 155946
+fe 155410
+jo 154213
+rc 153418
+rs 152891
+ev 152090
+má 151685
+ge 149620
+du 148604
+eñ 148189
+ás 147840
+rd 143745
+rl 140948
+ef 140844
+ud 138595
+ay 137728
+he 137661
+iz 135609
+pi 131004
+gi 130544
+u_ 130203
+lt 129307
+um 128273
+ut 125956
+ng 123639
+fu 123078
+ag 122690
+ru 122250
+á_ 120453
+rg 119777
+cl 118454
+up 117644
+je 114961
+if 111371
+ep 111127
+là109139
+cc 108651
+sc 107296
+én 106473
+ié 102726
+ÃÂt 102038
+au 100936
+ya 100714
+ke 96554
+ak 96273
+oy 95706
+rn 94938
+ip 94257
+og 89457
+fr 86113
+xi 84909
+aj 83563
+añ 83194
+av 82334
+án 82105
+_j 82076
+ju 81713
+ÃÂs 81591
+fa 80741
+bo 80355
+yo 80341
+uy 79884
+sm 79182
+tá 77025
+sr 73735
+bu 73729
+aà73349
+nv 72695
+lm 72212
+ÃÂ_ 72131
+az 70085
+ún 69452
+pt 66713
+z_ 65432
+ja 64884
+ez 64551
+é_ 64157
+t_ 63734
+és 62646
+rv 62004
+lg 61775
+dr 61647
+zo 56456
+ug 55861
+ña 53384
+nm 52522
+xp 50965
+ov 47830
+ub 47214
+ye 47052
+xt 45999
+óm 43829
+_ú 42590
+sà42209
+bs 41900
+_é 41811
+ó_ 41769
+hu 41642
+nz 41530
+té 39635
+ah 39455
+rq 39031
+ÃÂc 38565
+hi 38282
+gl 37984
+ué 37204
+aq 37184
+ól 37152
+af 36786
+ré 35957
+sf 35833
+nó 35655
+só 35280
+of 34967
+eq 33619
+bj 33536
+tà32404
+fl 31097
+sl 31060
+rz 30262
+uà29759
+oo 29525
+yu 29503
+iu 28864
+sd 27793
+ám 27712
+ér 27400
+_á 27083
+dà26878
+gn 26218
+lv 25724
+ác 25675
+ei 25481
+ou 25279
+úb 25133
+úl 24532
+mà24507
+ró 24458
+pú 24409
+ee 24161
+át 23643
+xc 22608
+ai 22556
+và21389
+ál 21326
+m_ 21272
+_k 20477
+ÃÂn 20278
+cà20127
+mú 19554
+c_ 19379
+gú 19319
+ét 19315
+ld 19284
+gà19239
+ÃÂd 19131
+lc 18911
+nq 18739
+oh 18666
+nn 18657
+uj 18178
+g_ 17539
+pc 17273
+uf 17227
+nj 16972
+cn 16728
+ae 16652
+iq 16628
+ij 16510
+có 16448
+ss 15795
+sg 14967
+mé 14624
+xa 14526
+ló 14455
+ÃÂf 14362
+rp 14304
+fà14173
+ls 14109
+zc 13782
+dé 13568
+_z 13519
+zó 13304
+oa 13280
+óx 13231
+tó 13020
+dm 12949
+ÃÂo 12862
+aú 12774
+nú 12576
+éc 12572
+uo 12403
+lq 12315
+uv 12260
+vé 12154
+lá 12028
+tt 11969
+rb 11926
+oi 11804
+bà11602
+óg 11293
+k_ 11224
+_w 11158
+nà11065
+ey 10907
+pp 10656
+él 10268
+ÃÂm 10130
+th 10079
+h_ 9673
+uz 9652
+b_ 9648
+ki 9623
+ór 9544
+ts 9117
+úm 8922
+ég 8862
+oq 8858
+áf 8727
+ko 8534
+zá 8489
+iá 8476
+dh 8412
+ár 8387
+sq 8334
+uá 8311
+ka 8270
+nl 8183
+vu 8159
+cá 8051
+rf 7774
+oz 7719
+oe 7505
+ná 7460
+né 7439
+oj 7384
+mó 7356
+éd 7338
+hà7211
+bt 7191
+áp 7121
+éx 7051
+sb 6927
+ck 6570
+dó 6498
+x_ 6460
+iñ 6385
+sé 6296
+ms 6230
+º_ 6212
+óv 6168
+à_ 6127
+mm 5995
+mc 5835
+bv 5784
+bá 5751
+nº 5607
+ps 5582
+lé 5574
+sv 5494
+pé 5478
+ux 5472
+cé 5453
+f_ 5433
+wa 5395
+_à5377
+eh 5363
+sh 5250
+gé 5223
+jó 5210
+ox 5205
+pà5146
+ao 5128
+xe 4984
+áx 4945
+ÃÂr 4888
+rj 4742
+v_ 4605
+lp 4477
+tú 4465
+aa 4454
+fá 4392
+ii 4319
+_ó 4288
+nh 4280
+pó 4102
+út 3996
+tl 3963
+óc 3854
+hr 3845
+lb 3759
+úa 3716
+ós 3702
+hl 3661
+wi 3617
+ód 3600
+we 3554
+dq 3521
+ée 3520
+eà3504
+tc 3498
+nk 3486
+aé 3455
+ik 3390
+oà3272
+ág 3260
+ff 3233
+dt 3179
+pá 3172
+ñe 3111
+xo 3052
+éf 3044
+ow 2985
+uq 2883
+bó 2858
+zi 2832
+fé 2831
+q_ 2830
+ji 2829
+ze 2798
+áb 2793
+ép 2778
+dá 2638
+_x 2627
+rk 2625
+ek 2623
+wo 2619
+hn 2584
+gü 2563
+sk 2544
+ÃÂb 2525
+mn 2499
+tn 2492
+ÃÂe 2486
+sn 2473
+gm 2466
+ñà2461
+bé 2459
+ph 2451
+ly 2427
+zq 2398
+áu 2397
+py 2389
+cp 2386
+ém 2366
+ym 2356
+ry 2325
+lf 2299
+dv 2290
+ht 2271
+ús 2261
+nr 2219
+ok 2152
+ys 2112
+xu 2092
+úe 2072
+tz 2061
+hm 2059
+_à2036
+èr 2024
+éb 1993
+zg 1983
+lz 1954
+gh 1935
+j_ 1932
+vá 1932
+gó 1924
+yn 1918
+fg 1911
+uu 1896
+tm 1885
+sá 1872
+rh 1855
+ÃÂz 1791
+ix 1777
+rú 1769
+ku 1749
+iè 1735
+fó 1707
+bc 1702
+by 1682
+zu 1635
+rö 1574
+zz 1542
+xh 1502
+bú 1495
+év 1493
+ÃÂg 1474
+ew 1449
+êt 1433
+lk 1397
+ln 1390
+nb 1379
+yr 1373
+jé 1357
+eó 1350
+óp 1341
+ft 1330
+kl 1302
+ky 1292
+rè 1290
+üe 1290
+ót 1247
+kr 1229
+ès 1227
+ör 1226
+dd 1220
+yó 1216
+ÃÂv 1196
+ÃÂp 1189
+hé 1184
+ds 1183
+vr 1160
+úc 1160
+dj 1152
+éu 1134
+my 1129
+hy 1122
+ös 1108
+ny 1105
+sw 1076
+ks 1068
+gg 1066
+éa 1061
+zm 1058
+dg 1056
+óf 1054
+yl 1053
+cm 1052
+ú_ 1050
+sy 1041
+w_ 1037
+dy 1023
+ws 1011
+lr 1003
+üà998
+öm 991
+cú 978
+xx 961
+gá 956
+js 933
+än 910
+cd 900
+jö 897
+sj 893
+há 887
+bö 875
+ty 862
+èm 859
+wu 858
+_ê 853
+lè 853
+eú 851
+rü 846
+kh 831
+mg 809
+oñ 806
+tb 793
+ax 785
+db 764
+bb 755
+lh 755
+yt 747
+wh 741
+üb 737
+yi 733
+gd 731
+qv 729
+ml 728
+gt 703
+uh 697
+aw 693
+cq 678
+dz 676
+jk 675
+ih 665
+êm 641
+bw 623
+jt 623
+wy 610
+_º 609
+ñi 579
+bd 578
+mê 572
+fú 562
+lú 558
+tw 554
+fs 547
+vó 547
+dn 543
+wl 540
+hó 526
+uk 526
+èg 521
+km 517
+éj 515
+öd 504
+gs 495
+pä 495
+eá 492
+fm 480
+ön 455
+hö 452
+üh 439
+pn 436
+iw 431
+wm 429
+zn 428
+uñ 422
+nw 420
+vc 416
+áv 408
+cy 407
+æk 405
+zú 402
+bæ 401
+cs 401
+yá 400
+ób 394
+mü 387
+ül 386
+bh 384
+hw 384
+hä 377
+úp 375
+áq 373
+ÃÂq 365
+éi 363
+éo 363
+rw 360
+éq 359
+df 356
+jn 349
+ça 348
+dü 340
+hú 339
+sö 339
+vs 333
+dl 328
+kj 326
+rê 326
+uó 320
+dw 319
+ój 319
+öl 319
+uw 318
+bn 317
+pm 311
+iö 309
+gy 306
+rô 301
+pv 300
+là299
+kk 297
+yb 295
+ôl 293
+tê 291
+är 288
+aî 287
+jà284
+kx 284
+kn 279
+iy 277
+dö 274
+cf 273
+wá 272
+kà271
+fä 267
+sò 262
+òl 262
+yé 261
+mf 260
+bk 259
+äm 259
+mt 257
+où 257
+ù_ 257
+úr 257
+ôt 253
+tè 252
+kä 251
+bm 245
+öh 245
+aç 238
+ög 238
+ão 230
+pk 228
+zb 226
+lö 223
+já 217
+ª_ 216
+ço 216
+öö 215
+sú 214
+öw 214
+ÃÂl 213
+dc 211
+jæ 206
+ær 205
+ñó 201
+bp 200
+ît 200
+_ª 199
+zh 199
+tf 195
+dk 192
+ør 190
+kt 189
+ût 189
+mh 183
+zs 183
+yp 179
+ün 179
+cè 177
+mr 174
+dè 172
+oû 172
+fn 170
+hd 170
+np 169
+zf 167
+kv 166
+pö 166
+ß_ 165
+kf 164
+wn 162
+qa 161
+hh 160
+oé 156
+aß 155
+xá 153
+yk 153
+xv 152
+gö 151
+rç 151
+èt 151
+pè 150
+jø 149
+vd 149
+lä 148
+ád 148
+yh 147
+ò_ 147
+yd 146
+cò 145
+cô 144
+hè 142
+wt 142
+eé 141
+zl 141
+nç 140
+fc 138
+gb 133
+hj 132
+gp 130
+pd 130
+ái 130
+âc 129
+áh 125
+áñ 125
+èd 123
+aó 121
+dp 118
+hk 117
+mè 117
+în 117
+vl 115
+tà112
+üi 112
+nè 110
+tx 109
+cb 106
+dú 106
+èn 106
+pê 105
+yy 105
+êc 104
+tg 103
+gc 102
+nä 102
+td 102
+äf 101
+yc 100
+pf 99
+xé 99
+iã 96
+tv 94
+pg 93
+vä 92
+jà91
+ür 90
+aï 89
+wr 88
+kg 87
+äy 87
+äl 86
+üs 86
+tp 85
+_ö 84
+ö_ 84
+nö 83
+èv 81
+tô 80
+tk 79
+xq 78
+rx 77
+rà77
+tj 77
+hb 76
+áj 76
+cg 75
+hô 75
+zr 75
+fp 74
+sä 73
+cv 72
+vm 72
+ÃÂj 72
+fy 71
+md 71
+èl 71
+ä_ 70
+hc 69
+ûr 69
+_ç 68
+çi 68
+hs 67
+hü 67
+sû 67
+éh 67
+xf 66
+às 66
+ñá 65
+ât 64
+rã 62
+ôm 62
+mà60
+pj 58
+râ 58
+tâ 57
+úd 57
+lü 55
+kö 54
+çu 54
+ñé 54
+gè 53
+mã 52
+vp 52
+dû 51
+vè 51
+úo 51
+eç 50
+gk 50
+uç 50
+hp 49
+bâ 48
+èc 48
+ïr 48
+jú 47
+xà47
+û_ 47
+fb 45
+cj 44
+fd 44
+öc 44
+yú 43
+jm 42
+zk 42
+Ã¥_ 42
+vn 41
+vg 39
+_Ã¥ 38
+cw 38
+uè 38
+vv 38
+sè 37
+ià36
+lj 36
+mw 36
+çk 36
+ël 36
+bg 34
+eå 34
+xó 34
+iú 33
+kw 33
+öt 33
+gv 32
+kp 32
+ñu 32
+ï_ 31
+üt 31
+_ì 30
+oî 30
+uê 29
+Ã¥r 29
+_â 28
+fè 28
+lw 28
+sz 28
+ww 28
+yg 28
+yw 28
+éé 28
+jü 27
+uß 27
+fk 26
+hf 26
+mk 26
+oá 26
+öv 26
+eß 25
+vy 25
+vê 25
+wk 25
+xy 25
+ßl 25
+ßb 24
+øl 24
+gw 23
+jd 23
+mö 23
+sø 23
+wü 23
+zp 22
+iç 21
+_de 2881514
+os_ 2125690
+de_ 2027446
+_la 1760852
+_co 1374446
+la_ 1344048
+es_ 1269730
+as_ 1249247
+_qu 1161992
+que 1159305
+ent 1148453
+ue_ 1121591
+el_ 1112663
+en_ 1093554
+_en 1048148
+_es 1010682
+ón_ 982853
+ión 964949
+est 926793
+nte 891485
+_el 842744
+te_ 831740
+con 812464
+_pr 784398
+_se 770866
+do_ 758957
+_lo 709822
+_y_ 673898
+_un 662238
+_po 628462
+aci 618161
+_pa 617515
+_a_ 609901
+ció 606777
+_re 604545
+res 599575
+to_ 598885
+ra_ 589984
+los 586695
+men 549895
+ado 535259
+ar_ 531096
+com 511324
+sta 503373
+par 500999
+or_ 490313
+_in 478194
+se_ 455959
+al_ 447173
+por 439074
+_ha 422939
+las 416886
+pre 411139
+_no 408312
+no_ 403945
+pro 398029
+tra 393160
+er_ 389386
+nto 388460
+cia 385578
+ien 384102
+ion 381995
+ta_ 376114
+ame 371200
+ida 357620
+ica 356060
+na_ 354123
+del 352298
+nci 347498
+cio 346080
+one 345976
+ara 326595
+dad 325713
+mos 325327
+ia_ 319572
+lo_ 317408
+una 312803
+on_ 308949
+_si 300307
+ant 298789
+nes 298324
+rop 293508
+dos 290549
+_so 289739
+_al 288516
+an_ 285098
+rec 277276
+_su 273106
+re_ 272498
+ues 272281
+da_ 271840
+ro_ 270983
+nta 267506
+_di 267463
+des 266876
+_me 264237
+_p_ 261367
+era 260251
+_pe 260162
+per 259974
+un_ 258646
+ste 250000
+ter 249077
+enc 247104
+ten 245715
+mis 244791
+ad_ 236729
+uro 235459
+tar 233669
+pue 231966
+me_ 231619
+spe 231125
+isi 230807
+tad 230144
+ons 228687
+les 228445
+ici 227926
+sió 221318
+den 220123
+_ca 216574
+mo_ 215616
+tos 214096
+str 210423
+eur 209973
+_tr 209579
+esi 208483
+io_ 207569
+sid 206967
+ido 206453
+_eu 205459
+tic 205308
+ntr 204481
+ada 203659
+ari 202182
+_cu 201308
+_mi 200226
+ide 199803
+_ac 197774
+omi 197380
+nos 195995
+tiv 194819
+bre 193585
+esp 193227
+_ma 192215
+ca_ 191499
+tan 190902
+_ta 190194
+orm 190110
+emo 188141
+ect 186666
+ero 184009
+eci 183640
+mie 181875
+ale 181412
+ndo 180549
+rio 179945
+ÃÂa_ 179822
+ist 179783
+for 179696
+ier 178532
+ble 178288
+uni 176502
+sti 175718
+_to 175350
+_te 175345
+ope 175123
+tam 175056
+pea 174732
+ran 174528
+ona 174098
+ene 174032
+end 170620
+ere 168582
+sto 166858
+ont 166374
+tro 165744
+_pu 164112
+ha_ 163321
+ros 162977
+_ex 161981
+esa 161907
+deb 159524
+der 155128
+mbi 154467
+_na 150837
+ese 150486
+int 150349
+das 149806
+amb 148524
+_mu 147667
+ir_ 147353
+ina 146450
+so_ 145462
+gra 144575
+tes 144017
+cto 142671
+cho 142555
+ás_ 139200
+edi 138948
+art 138636
+ma_ 136784
+rÃÂa 136276
+cue 136013
+obr 135975
+ora 135880
+tod 135548
+co_ 134641
+ea_ 134415
+lam 133978
+más 133831
+omo 133407
+_nu 132358
+_as 132219
+señ 130620
+ita 130370
+and 129734
+ece 129063
+_ap 128959
+ria 128838
+sar 128235
+qui 128154
+ort 128085
+sob 126806
+ser 126369
+fic 125573
+le_ 125220
+egu 125029
+nal 123663
+iva 123457
+ico 122767
+ali 122542
+ces 122073
+lar 121807
+rma 121173
+eño 121028
+emp 120840
+eri 120583
+dic 120125
+rta 119903
+mpl 119690
+rac 118941
+nue 118643
+odo 118553
+iza 118365
+uer 118218
+eo_ 116341
+amo 116066
+ade 116004
+man 115207
+ura 115138
+ial 115086
+ñor 114888
+ner 114429
+cer 113824
+_má 113502
+ren 112745
+imp 112412
+pon 112277
+sen 112173
+nam 111833
+_id 110958
+ace 110788
+cas 110662
+ios 110041
+lic 109999
+ech 109960
+mer 109827
+mpo 109506
+_mo 108827
+unt 108504
+tas 107990
+dec 107814
+su_ 107591
+ebe 107433
+lan 107245
+pos 107158
+_cr 107120
+arl 106804
+nda 106667
+ras 106557
+_im 106330
+nse 105186
+jo_ 105111
+inc 104519
+ati 104128
+cie 103979
+nfo 103954
+inf 103309
+ema 102925
+va_ 102904
+_gr 102811
+ili 102663
+tur 100869
+rme 100245
+_ve 99524
+go_ 99425
+tal 99074
+ejo 98871
+med 98855
+_le 98635
+omp 98266
+uci 98250
+rla 97330
+cci 96983
+seg 96785
+imi 96652
+id_ 96407
+mbr 96364
+_he 96320
+lid 96286
+cre 95782
+tor 95539
+én_ 95439
+abl 95433
+_fi 95234
+_fu 95052
+nió 95026
+iem 94958
+anc 94857
+pol 94809
+ién 94788
+min 94429
+ued 94389
+pec 93787
+rad 93612
+rat 93579
+pri 93120
+rar 93080
+ÃÂti 92836
+emb 92223
+dem 91896
+ker 91842
+nde 91725
+_sp 91693
+ore 91417
+_ad 91348
+ede 91314
+ake 90842
+eak 90327
+ho_ 90305
+ate 89901
+bié 89895
+erc 89617
+ral 89587
+reg 89523
+rte 89403
+sin 89199
+tie 89083
+ver 88938
+rea 88726
+_ti 88561
+gun 88263
+car 88142
+eco 87814
+nti 87672
+ndi 87635
+llo 87473
+_vi 87192
+cua 87065
+ce_ 87043
+cti 86529
+ias 86474
+eso 86256
+_em 85908
+cul 85900
+ivo 85886
+mas 85767
+ber 85715
+itu 85509
+oci 85362
+act 85203
+_ne 84997
+ust 84731
+_ci 84531
+ert 84528
+olà84333
+_ob 84162
+osi 84140
+son 83817
+lÃÂt 83694
+ses 83511
+ual 83410
+uen 83246
+_an 83216
+cos 83046
+cad 82436
+otr 82391
+aba 82077
+ori 81667
+pli 81579
+ers 81330
+_sa 81229
+_fo 80420
+tre 80164
+bie 79495
+ela 79361
+hac 78416
+ini 77951
+ome 77919
+gar 77878
+ond 77726
+mar 77567
+in_ 76791
+gen 76729
+leg 76470
+nst 76458
+nsi 76270
+vo_ 75991
+fin 75920
+uie 75898
+sol 75659
+mun 75609
+nic 75164
+ata 74586
+cha 74070
+und 73968
+nac 73447
+nid 73355
+rá_ 73020
+ens 72787
+ya_ 72657
+duc 72575
+ne_ 72567
+sa_ 72313
+dis 72183
+uda 72116
+ult 71998
+ven 71943
+erd 71883
+lac 71773
+lem 71344
+are 71147
+rti 70921
+ano 70503
+tem 70347
+spo 70238
+ism 70186
+aÃÂs 69393
+nas 69385
+paà69127
+rid 69122
+_sr 69092
+mpr 68915
+si_ 68890
+ern 68870
+_au 68396
+tua 68233
+_ot 67562
+dir 67550
+ifi 67157
+_va 66862
+did 66691
+sit 66668
+ele 66565
+alm 66552
+eda 66530
+stá 66249
+ram 66055
+lme 65949
+tri 65740
+_am 65710
+ani 65666
+peo 65618
+eme 65412
+ito 65180
+uch 64993
+ime 64584
+rse 64297
+nad 64191
+po_ 63736
+liz 63703
+sus 63626
+sej 63612
+_ni 63497
+_fa 63495
+pod 63469
+rob 63461
+ref 63199
+_lu 62952
+rab 62903
+tac 62886
+gua 62850
+onc 62799
+sos 62783
+_li 62764
+fer 62296
+egi 61962
+ino 61527
+ula 61498
+_ba 61495
+nec 61263
+obl 61262
+han 61144
+us_ 61138
+ple 60881
+bro 60825
+_ju 60731
+_pl 60304
+ell 60237
+opu 59758
+baj 59722
+pla 59533
+ami 59408
+cid 59375
+_or 59176
+rim 59135
+ete 58887
+rol 58840
+erv 58804
+cac 58769
+hay 58749
+ctu 58742
+imo 58649
+ecu 58643
+cam 58635
+ota 58566
+hab 58285
+_do 57592
+oce 57516
+smo 57499
+erm 57410
+dar 57286
+err 57235
+can 57146
+_vo 56990
+nen 56814
+zar 56730
+mit 56643
+ins 56473
+ega 56446
+rro 56222
+bil 55926
+án_ 55788
+cir 55771
+alg 55766
+tab 55729
+esu 55402
+nce 54971
+cla 54949
+eti 54949
+roc 54846
+sup 54554
+tit 54429
+nve 54378
+rel 54269
+_da 54258
+sio 54231
+tim 54150
+exi 53971
+efe 53923
+cen 53909
+tid 53847
+olu 53764
+igu 53733
+lta 53662
+aso 53645
+_ce 53626
+arr 53569
+sis 53434
+_ho 53088
+dor 52948
+eno 52790
+_o_ 52760
+nsa 52698
+eni 52654
+eva 52299
+_op 52032
+ima 51916
+año 51873
+arg 51861
+rmi 51828
+dam 51792
+ind 51740
+hos 51631
+soc 51568
+cor 51565
+vis 51325
+efi 51165
+asi 51136
+rod 51127
+ún_ 51120
+exp 50963
+luc 50881
+omu 50598
+eta 50477
+ogr 50371
+sig 50196
+ibl 50128
+_ag 50039
+rso 50015
+dan 49918
+_añ 49902
+hor 49853
+be_ 49835
+rca 49636
+ÃÂse 49519
+lec 49309
+pa_ 49227
+erà49210
+gui 49102
+sas 49033
+_fr 48988
+dif 48781
+col 48760
+esc 48723
+ord 48611
+asa 48592
+cis 48562
+eba 48333
+pet 48322
+oda 48306
+rem 48263
+lle 48240
+cip 48203
+ire 48170
+nar 48111
+acu 48068
+sr_ 48045
+gur 47923
+ans 47922
+ama 47731
+sib 47598
+dia 47567
+_ya 47560
+odu 47538
+eal 47322
+_ec 47166
+dio 47147
+fue 47142
+clu 47044
+sie 47037
+ena 46987
+muc 46879
+rep 46777
+ric 46741
+ret 46704
+ngu 46587
+lla 46383
+uev 46363
+rdo 46173
+iti 46132
+opi 45869
+uy_ 45853
+uno 45836
+cta 45802
+abo 45774
+oy_ 45685
+pen 45606
+mpe 45512
+tin 45378
+muy 45346
+reo 45331
+ana 45330
+ext 45292
+fun 45227
+_ar 45200
+gan 45115
+vid 45105
+bar 44908
+isa 44827
+sab 44676
+rie 44444
+uan 44367
+_ll 44353
+ced 44328
+yo_ 44328
+_ge 44225
+ast 44153
+ará 44142
+age 44101
+rno 44070
+ron 43782
+opa 43542
+bli 43475
+sec 43207
+ono 43072
+lib 43065
+nor 42771
+nan 42765
+onf 42527
+vos 42481
+vas 42382
+ala 42368
+ior 42315
+sea 42290
+ocu 42288
+opo 42264
+amp 42206
+zac 42138
+ode 42108
+abi 42096
+fec 42052
+za_ 41979
+acc 41846
+_ab 41745
+rin 41741
+rog 41737
+bra 41710
+bat 41700
+rre 41553
+iac 41498
+tir 41493
+evi 41422
+_cl 41242
+uir 41162
+len 40960
+pac 40836
+uct 40751
+_ra 40708
+ajo 40409
+ost 40361
+uga 40311
+mi_ 40303
+ncl 40233
+nmi 40168
+mod 39962
+ay_ 39890
+eli 39877
+_du 39784
+_ga 39784
+eje 39740
+sÃÂ_ 39676
+ga_ 39659
+tá_ 39595
+rgo 39535
+lia 39458
+tru 39375
+arc 39284
+apo 39262
+rda 39257
+ge_ 39234
+oll 39214
+apr 39154
+oso 39050
+cal 39033
+rqu 39013
+ume 38948
+ez_ 38917
+pta 38890
+ars 38744
+ibi 38607
+abe 38557
+upo 38495
+ang 38486
+rev 38477
+_hu 38411
+lab 38371
+sic 38300
+lgu 38187
+uac 38123
+ola 38086
+_ej 38003
+pas 37888
+lad 37446
+rci 37352
+iga 37319
+zad 37281
+ase 37130
+mic 37073
+rib 36975
+cri 36957
+lug 36785
+ing 36546
+ole 36544
+uto 36525
+és_ 36497
+_ah 36485
+ato 36313
+tió 36164
+nis 36075
+ÃÂas 36038
+nza 35968
+_bi 35967
+ayo 35953
+enm 35687
+ich 35591
+rna 35463
+mil 35390
+onv 35315
+agr 35262
+rán 35087
+cep 35067
+icu 35048
+rup 35037
+may 34980
+has 34918
+ane 34916
+lat 34875
+bor 34854
+sul 34759
+aqu 34605
+_ef 34590
+rit 34548
+ivi 34544
+oca 34331
+hec 34302
+hem 34240
+uma 34156
+jet 34059
+iar 34035
+iad 33897
+ive 33821
+rga 33799
+is_ 33797
+cit 33787
+ños 33672
+ben 33627
+equ 33609
+_oc 33582
+sca 33570
+lti 33514
+lim 33489
+_us 33466
+bje 33452
+uri 33396
+_só 33387
+mac 33311
+red 33270
+van 33134
+ecc 33122
+nit 33122
+sól 33071
+ote 33016
+aho 32939
+abr 32929
+obj 32916
+bas 32891
+nco 32881
+yor 32770
+mej 32739
+apl 32676
+gru 32637
+mba 32608
+ian 32604
+nom 32450
+asu 32400
+ite 32347
+orà32336
+anz 32208
+omb 32071
+pun 32009
+apa 31995
+oba 31992
+jor 31837
+pal 31727
+evo 31721
+ólo 31699
+vot 31629
+upu 31395
+sad 31376
+nóm 31294
+poy 31277
+xis 31253
+osa 31193
+unc 31123
+aut 31038
+_bu 30990
+uag 30781
+_ev 30624
+jer 30566
+val 30538
+onó 30485
+rde 30443
+_ay 30396
+isp 30239
+asà30173
+pio 30142
+bla 30079
+ego 30076
+log 30056
+emá 30050
+sal 30049
+die 30012
+ómi 30001
+orq 29970
+inv 29936
+arà29886
+noc 29841
+sum 29811
+tán 29807
+tec 29728
+uis 29703
+mat 29694
+cur 29659
+gue 29634
+cab 29625
+rom 29597
+ept 29572
+rto 29566
+ill 29437
+eng 29275
+il_ 29269
+cum 29229
+ibu 29204
+rot 29180
+orr 29167
+pes 29088
+usi 29006
+cim 28941
+_at 28901
+ulo 28855
+lig 28677
+lus 28646
+aya 28586
+mon 28516
+fra 28509
+quà28330
+ruc 28304
+ine 28284
+he_ 28231
+def 28219
+spu 28066
+iud 28026
+ciu 27959
+sun 27930
+eto 27737
+bem 27722
+ño_ 27624
+erá 27485
+_pi 27480
+isc 27480
+uta 27392
+_aq 27336
+ris 27256
+_fe 27231
+adi 27218
+plo 27137
+_go 27074
+mid 27072
+hum 27026
+esd 27006
+teg 26896
+nem 26895
+sde 26788
+oli 26715
+til 26614
+mad 26603
+lev 26576
+ayu 26539
+niz 26539
+nsu 26456
+ba_ 26388
+alt 26374
+ipa 26351
+eña 26279
+uti 26263
+yud 26208
+sam 26200
+aña 26030
+fre 25803
+vez 25720
+ibe 25660
+cil 25653
+mes 25604
+aja 25599
+_af 25578
+ucc 25569
+mpa 25537
+aca 25535
+gas 25475
+tio 25455
+sla 25408
+ted 25385
+coo 25350
+cap 25313
+uso 25274
+bit 25213
+nif 25171
+sim 25070
+nsp 25069
+tuc 24957
+obs 24880
+ban 24850
+_gu 24849
+dim 24848
+var 24820
+rtu 24811
+uid 24790
+rra 24750
+olo 24732
+aro 24692
+cup 24666
+sem 24600
+ife 24511
+qué 24475
+san 24354
+púb 24297
+úbl 24296
+últ 24267
+spa 24265
+pin 24214
+rco 24055
+lis 24031
+odr 23882
+tom 23814
+udi 23791
+org 23769
+ué_ 23758
+oco 23702
+rlo 23671
+_de_ 1909011
+_la_ 1294847
+que_ 1077731
+_que 1057739
+ión_ 964907
+_en_ 851249
+_el_ 751970
+_con 735235
+ción 604228
+_est 584167
+los_ 581931
+nte_ 559288
+_los 546261
+ente 535287
+_com 495912
+ment 471587
+_par 442253
+las_ 412459
+ació 397415
+_las 387206
+esta 363282
+_pro 345466
+_del 342482
+_se_ 340210
+del_ 327929
+_por 325109
+ado_ 317400
+_pre 313575
+mos_ 312219
+nto_ 302788
+nes_ 289937
+por_ 287398
+dos_ 284158
+_no_ 279200
+una_ 277567
+cion 275985
+amen 273722
+_una 273213
+ones 263882
+pres 261459
+ento 256656
+_un_ 255944
+para 255247
+ara_ 253212
+uest 247880
+ione 245640
+idad 236160
+_es_ 235396
+les_ 221989
+sión 221316
+con_ 219771
+dad_ 219249
+enci 212860
+tos_ 211213
+ncia 207094
+euro 205761
+_eur 204711
+cons 204330
+enta 200478
+ante 197514
+sta_ 195490
+urop 190707
+ient 186757
+tado 181222
+cia_ 179771
+omis 177943
+comi 177671
+_des 175823
+nos_ 175406
+_tra 174018
+_per 170310
+bre_ 166989
+isió 164790
+emos 162088
+form 160791
+_al_ 159841
+_res 159575
+_deb 159141
+ido_ 159016
+ados 158642
+ndo_ 155617
+side 154811
+ica_ 153169
+ste_ 152926
+acio 152866
+das_ 149494
+rope 148436
+ales 147783
+misi 146602
+iden 145483
+ros_ 144380
+cont 143442
+ero_ 143232
+resi 142964
+dent 141343
+esid 140958
+_lo_ 140502
+pues 140272
+res_ 137480
+tes_ 136645
+_int 136247
+esto 135815
+más_ 133772
+_ha_ 133553
+obre 131306
+ambi 131112
+este 129380
+_tod 129327
+mien 127609
+_señ 127567
+_sob 126751
+inte 125653
+estr 125194
+sobr 124890
+_pue 121679
+omo_ 121677
+como 120772
+iona 120125
+_nue 117994
+seño 115331
+eñor 114865
+lame 114678
+amos 113912
+tica 111964
+nter 111225
+ntes 110979
+espe 110397
+part 108799
+tant 108168
+_más 107591
+_su_ 107477
+raci 107418
+port 106709
+ada_ 106690
+era_ 106381
+ario 105516
+_uni 105105
+debe 104942
+tas_ 103103
+_inf 103038
+entr 102280
+_ser 102263
+_imp 102170
+tiva 101384
+name 101139
+tar_ 101129
+ios_ 100860
+prop 99038
+nfor 98891
+ecto 98432
+_tam 97350
+comp 97216
+resp 96233
+onse 95593
+nión 94751
+sto_ 94667
+_id_ 94435
+todo 93913
+medi 93664
+rÃÂa_ 93045
+ntra 92628
+ame_ 92618
+orma 92176
+ras_ 91852
+ién_ 91585
+ontr 91481
+ker_ 91468
+lida 91131
+_spe 90785
+_nam 90477
+aker 90373
+spea 90346
+peak 90316
+eake 90315
+spec 90264
+des_ 90249
+_pol 90161
+info 89862
+cial 89835
+cho_ 89819
+rio_ 89363
+_rec 89160
+tamb 89126
+bién 89083
+mbié 88965
+segu 88763
+ÃÂtic 88426
+_pri 88418
+esti 88025
+_ten 87152
+_med 86694
+_dec 86571
+arla 86394
+ias_ 85309
+_sin 84409
+echo 84054
+stad 83919
+opea 83796
+esar 83724
+lÃÂti 83682
+polà83644
+onal 83565
+olÃÂt 83540
+ores 81979
+parl 81654
+ando 81337
+posi 80749
+rlam 80489
+_ent 80086
+ria_ 79071
+tra_ 78778
+iend 78718
+unió 78603
+orme 78471
+able 78343
+stra 78299
+pero 78023
+_qui 77848
+_hac 77397
+tivo 77368
+orta 77005
+_esp 76719
+pued 76538
+_seg 76528
+sent 76310
+_cua 76134
+rme_ 75971
+pea_ 75578
+ico_ 74800
+deci 74348
+nues 74070
+ntos 73756
+mas_ 73675
+ñor_ 73322
+aria 73125
+ble_ 72872
+icio 72619
+ses_ 71829
+_pos 71798
+rese 71794
+fica 71554
+trat 71237
+tari 71123
+_cre 71022
+unto 70881
+iva_ 70337
+odo_ 69808
+naci 69773
+_tie 69696
+cció 69353
+paÃÂs 69126
+_paà69124
+nas_ 68429
+nta_ 67930
+esen 67781
+impo 67499
+laci 66961
+cto_ 66749
+_dis 66479
+ativ 66304
+tura 66018
+ora_ 65801
+lmen 65734
+ener 65701
+eces 65167
+teri 65154
+_nos 64905
+_gra 64406
+tros 64368
+alme 64189
+ejo_ 64110
+stas 64092
+nal_ 64019
+rte_ 63964
+hace 63627
+nsej 63609
+tro_ 63277
+_pod 63276
+_sus 63146
+_cue 63047
+opeo 62991
+_si_ 62945
+_otr 62926
+anci 62884
+sejo 62877
+mpor 62796
+ial_ 62719
+liza 62416
+iene 61955
+pone 61949
+embr 61900
+prob 61872
+cer_ 61864
+reci 61425
+_fin 61340
+iste 61249
+ific 61176
+está 61136
+ctiv 61115
+itar 60590
+iemb 60487
+lica 60357
+sari 60302
+quie 60298
+_mie 59784
+rse_ 59694
+rech 59611
+nece 59569
+_ref 59124
+_hay 58737
+rar_ 58692
+tien 58613
+ades 58508
+llo_ 58369
+han_ 58168
+emen 58104
+_act 57649
+_han 57553
+_reg 57531
+_hab 57385
+dade 57309
+rida 57016
+ntar 56677
+caci 56366
+ismo 56102
+econ 56085
+_nec 55985
+pect 55952
+ropu 55806
+cos_ 55691
+arti 55592
+imie 55518
+rtan 55452
+stro 54996
+_alg 54989
+sos_ 54904
+cas_ 54834
+resu 54745
+rata 54734
+opue 54647
+_der 53949
+uede 53690
+otro 53669
+conc 53645
+sion 53563
+_for 53467
+taci 53455
+_tan 53332
+adas 53189
+dere 53105
+erec 52846
+mbro 52595
+sin_ 52547
+_rea 52501
+tene 52492
+enda 52467
+icac 52415
+_man 52199
+miem 52172
+_ins 52168
+_dem 52152
+_rel 52065
+ocia 51947
+stos 51893
+nten 51840
+tran 51358
+ntre 51236
+cado 51094
+_inc 51066
+son_ 50820
+ivo_ 50796
+cuen 50752
+tre_ 50752
+_exp 50731
+_emp 50704
+chos 50607
+cias 50601
+soci 50554
+_ant 50517
+anto 50308
+_me_ 50295
+sus_ 50170
+eren 50144
+acer 50056
+uier 50034
+bili 50032
+raba 49782
+ible 49680
+comu 49673
+hos_ 49672
+ida_ 49667
+omun 49660
+ista 49620
+aÃÂse 49484
+ÃÂses 49484
+peo_ 49479
+icas 49239
+gar_ 48975
+_dir 48833
+desa 48788
+arte 48586
+pera 48541
+anos 48509
+proc 48354
+trab 48280
+iera 48184
+_sr_ 48021
+odos 47986
+smo_ 47930
+bien 47917
+cien 47868
+muni 47810
+empl 47679
+ilid 47610
+titu 47502
+ema_ 47406
+tras 47352
+sas_ 47267
+abaj 47257
+rela 47208
+_ya_ 47198
+rado 47184
+eso_ 47133
+rodu 47051
+_mar 46880
+_muc 46864
+much 46857
+mpre 46438
+bros 46430
+unid 46343
+ino_ 46246
+blem 46149
+icos 46096
+mina 46036
+lar_ 46009
+_dic 45995
+zar_ 45923
+erio 45886
+ran_ 45834
+_son 45821
+ede_ 45541
+onsi 45466
+mple 45420
+tal_ 45355
+_muy 45346
+muy_ 45336
+tenc 45149
+real 45075
+merc 45074
+ució 45037
+_mis 44989
+idas 44916
+dida 44826
+demo 44805
+mpli 44765
+prim 44744
+ntro 44695
+_ell 44664
+spon 44577
+roce 44463
+rios 44392
+_soc 44342
+nuev 44042
+mism 44003
+cuer 43942
+ecis 43905
+ral_ 43837
+_año 43773
+oduc 43561
+_sol 43496
+fina 43429
+_ind 43427
+clar 43409
+_acu 43351
+hora 43314
+_exi 43290
+star 42899
+endo 42810
+uerd 42806
+omen 42697
+lega 42550
+ner_ 42512
+_pla 42503
+conf 42442
+vos_ 42332
+erdo 42327
+acia 42311
+egun 42297
+erca 42102
+zaci 42092
+izac 42091
+ropa 42085
+rime 42042
+aliz 41909
+icia 41901
+ició 41743
+rior 41587
+ello 41411
+rans 41369
+_cas 41222
+resa 41211
+plic 41200
+ser_ 41151
+stit 41099
+toda 41020
+egur 40964
+_eco 40934
+rect 40863
+ecti 40822
+ito_ 40777
+opa_ 40764
+nera 40754
+serv 40730
+tico 40711
+erÃÂa 40606
+pers 40567
+iaci 40449
+reco 40195
+nda_ 40194
+tan_ 40056
+prod 39987
+cuan 39951
+cio_ 39833
+cues 39763
+vas_ 39744
+dire 39719
+sist 39688
+acue 39642
+bajo 39629
+stá_ 39545
+deba 39464
+nclu 39439
+_mi_ 39265
+rece 39262
+irec 39249
+tema 39242
+hay_ 39040
+ogra 38994
+stru 38891
+ctor 38875
+_mod 38854
+gran 38837
+rant 38819
+lema 38810
+tori 38614
+mbre 38489
+den_ 38449
+nida 38359
+arro 38324
+osib 38265
+_men 38196
+ura_ 38162
+solu 38161
+_apr 38160
+arse 38091
+ebe_ 37929
+cir_ 37910
+uaci 37897
+imer 37868
+rgo_ 37841
+algu 37704
+ene_ 37674
+dame 37664
+ulta 37615
+nale 37607
+oble 37513
+_fun 37421
+ermi 37410
+dese 37389
+_car 37387
+_apo 37368
+ugar 37260
+inst 37225
+nsti 37188
+ebat 37136
+cier 37104
+dera 36916
+iero 36844
+ctos 36838
+tido 36830
+der_ 36825
+_eje 36823
+inci 36815
+_lug 36760
+luga 36760
+uent 36682
+edid 36661
+_rep 36424
+oluc 36381
+tabl 36301
+alid 36292
+lgun 36271
+_pon 36266
+roll 36253
+sarr 36227
+fere 36181
+rrol 36164
+ende 36078
+rdo_ 36038
+ÃÂas_ 36032
+_ver 35998
+ntal 35943
+_ter 35915
+luci 35792
+robl 35714
+nció 35655
+ncio 35582
+onst 35570
+aso_ 35515
+unta 35422
+dici 35387
+_lan 35336
+fect 35323
+espo 35306
+conv 35275
+_mer 35251
+_enm 35249
+emas 35016
+_may 34958
+ador 34951
+fici 34885
+edio 34829
+pare 34675
+mayo 34674
+icul 34587
+rogr 34569
+prog 34499
+enmi 34403
+nmie 34401
+erso 34400
+_fue 34387
+tamo 34369
+cono 34332
+stió 34308
+ngua 34288
+cesi 34266
+stan 34195
+renc 34177
+ctua 34167
+come 34158
+idos 34120
+tión 34081
+ual_ 34061
+_pas 33972
+iemp 33957
+erna 33956
+empr 33914
+ajo_ 33829
+dar_ 33804
+caso 33788
+argo 33787
+stab 33673
+_hem 33618
+rma_ 33580
+izar 33559
+_lle 33526
+unda 33503
+_dif 33488
+nido 33474
+_sig 33402
+regu 33365
+ecir 33332
+ider 33229
+ños_ 33197
+ivos 33137
+_cla 33113
+fuer 33083
+tame 33068
+hemo 32928
+eral 32927
+obje 32916
+_obj 32907
+_sól 32876
+_lib 32847
+ecci 32803
+nsid 32770
+hech 32768
+remo 32723
+umen 32708
+_col 32707
+_agr 32692
+_aho 32583
+_apl 32560
+ahor 32450
+rtic 32450
+lang 32425
+erac 32423
+grup 32380
+tend 32306
+cesa 32296
+ayor 32212
+anti 32187
+rent 32167
+tici 32144
+actu 32136
+plan 32036
+orÃÂa 32004
+sici 31897
+_hec 31870
+ueda 31869
+angu 31819
+bjet 31751
+perm 31748
+ucho 31748
+onte 31731
+bate 31691
+abor 31661
+_asu 31623
+nica 31611
+_vot 31602
+prec 31572
+age_ 31564
+acci 31562
+_ace 31553
+cult 31539
+sper 31527
+sibl 31501
+rupo 31448
+_gru 31373
+punt 31354
+_sen 31337
+sult 31334
+sólo 31325
+ólo_ 31322
+apoy 31262
+anza 31207
+_cor 31106
+xist 31086
+dich 31067
+exis 31008
+isar 30920
+_cam 30916
+ecta 30898
+_ade 30885
+_enc 30865
+tern 30829
+ucha 30768
+rson 30760
+dore 30755
+guag 30729
+uage 30729
+sona 30708
+reo_ 30683
+rque 30653
+inan 30593
+supu 30587
+esa_ 30570
+ejor 30517
+mejo 30517
+_mej 30506
+reso 30459
+upue 30376
+eber 30344
+ensa 30317
+enti 30292
+sten 30263
+ate_ 30236
+_gen 30210
+teni 30206
+paci 30078
+ular 30077
+_pun 30038
+_asà30032
+eali 30024
+ien_ 30017
+asÃÂ_ 30000
+ómic 29982
+orqu 29969
+uir_ 29916
+porq 29871
+_inv 29856
+_sup 29766
+_sit 29724
+bier 29689
+osic 29649
+nómi 29643
+pode 29612
+onóm 29608
+rinc 29496
+disp 29489
+conó 29472
+ncip 29470
+_acc 29449
+nado 29448
+itua 29442
+prin 29438
+erta 29436
+ecia 29392
+tuac 29392
+ompr 29371
+_nac 29348
+rama 29304
+ucio 29295
+rán_ 29286
+ural 29263
+egui 29260
+trib 29258
+eten 29240
+eres 29099
+dada 29091
+cios 29075
+udad 28930
+misa 28911
+ribu 28905
+incl 28878
+ntad 28860
+ivas 28852
+apro 28825
+gram 28747
+blic 28656
+cada 28615
+cha_ 28613
+cual 28563
+cond 28525
+tent 28511
+marc 28487
+imos 28412
+leme 28394
+creo 28379
+_sea 28340
+maci 28299
+nent 28287
+elac 28280
+car_ 28110
+fund 28107
+unos 28095
+situ 28051
+bles 28035
+cula 28029
+ndic 28011
+uro_ 28006
+iuda 28001
+cisi 27994
+onve 27967
+ciud 27954
+otra 27944
+_ext 27898
+regi 27845
+uand 27813
+quis 27804
+lara 27786
+vida 27778
+once 27750
+bemo 27693
+_ele 27661
+asta 27625
+esió 27601
+ces_ 27523
+_def 27514
+_aut 27493
+uman 27489
+_pes 27475
+istr 27418
+iale 27364
+amie 27326
+_aqu 27324
+ollo 27321
+lati 27258
+nen_ 27248
+_ciu 27231
+apli 27208
+sunt 27182
+ará_ 27180
+tual 27172
+vist 27158
+asun 27070
+rcad 27066
+grac 27017
+nar_ 27015
+stri 27003
+nada 26984
+venc 26970
+_bie 26898
+desd 26887
+dica 26827
+_nor 26824
+ompe 26812
+arec 26782
+vers 26776
+esde 26773
+nist 26761
+sde_ 26630
+unci 26601
+nita 26562
+uisi 26544
+_cie 26535
+lant 26526
+_sec 26494
+onen 26471
+_ayu 26461
+_hum 26442
+icar 26435
+eros 26434
+sigu 26396
+iert 26389
+terr 26350
+oced 26339
+niza 26337
+arÃÂa 26327
+cept 26321
+ece_ 26289
+ayud 26207
+huma 26193
+rias 26174
+cent 26168
+truc 26165
+tale 26160
+_cos 26103
+rale 26017
+icad 26006
+_mil 25993
+erci 25975
+peci 25956
+adan 25920
+imo_ 25912
+sino 25872
+ceso 25867
+edad 25867
+_red 25847
+años 25844
+_bas 25837
+_emb 25836
+_ese 25816
+uste 25792
+undo 25780
+nanc 25756
+timo 25732
+esul 25685
+guna 25683
+tiem 25662
+erno 25658
+nde_ 25654
+prot 25646
+_vis 25609
+empo 25582
+jeti 25559
+zado 25545
+etiv 25532
+yuda 25524
+ucci 25518
+_le_ 25500
+norm 25488
+cimi 25485
+vez_ 25483
+demá 25410
+emás 25407
+dio_ 25390
+urid 25384
+orte 25357
+trar 25308
+_coo 25305
+denc 25300
+guri 25255
+mpo_ 25241
+tir_ 25239
+_amp 25238
+rmac 25233
+iado 25210
+prom 25199
+_vez 25196
+_leg 25187
+abil 25107
+nici 25095
+emba 25087
+tanc 25052
+lici 25041
+nemo 25040
+sar_ 25022
+legi 25019
+oper 25000
+ace_ 24976
+roba 24968
+mbar 24935
+_tem 24932
+ater 24926
+tuci 24925
+ituc 24907
+_eso 24857
+_obs 24829
+_sid 24795
+onas 24774
+labo 24764
+lado 24751
+upo_ 24733
+esup 24731
+efic 24725
+uda_ 24654
+ampl 24653
+_sal 24555
+vota 24532
+clus 24531
+gene 24530
+sted 24518
+cipa 24487
+esas 24442
+eria 24386
+públ 24296
+úbli 24296
+últi 24264
+_esc 24244
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/nl.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/nl.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/nl.ngp (working copy)
@@ -1,1002 +1,3059 @@
-# NgramProfile generated at Sat Sep 25 16:08:32 EEST 2004 for Nutch Language Identification
-ngram_count 19315142
-e 1251063
-_ 1216012
-n 656259
-i 471611
-a 455368
-t 440137
-r 407988
-o 392199
-d 376304
-n_ 343056
-en 299019
-e_ 258418
-s 251386
-l 236882
-g 208842
-en_ 194240
-de 192729
-t_ 183649
-v 180732
-m 172636
-er 161510
-h 150676
-k 139690
-an 122675
-u 122151
-te 111802
-ge 100754
-b 98847
-in 97762
-c 96268
-w 95453
-p 95417
-et 91793
-j 88374
-r_ 87749
-ie 84747
-he 83288
-ee 82529
-z 81211
-aa 80590
-ij 80205
-el 79902
-an_ 70217
-et_ 69981
-or 69059
-s_ 67527
-st 60975
-at 60949
-va 60228
-re 60183
-me 58394
-ve 58026
-oo 57780
-ng 55952
-le 55871
-nd 53827
-van 52050
-g_ 50750
-be 50015
-ar 48623
-li 47394
-is 46577
-d_ 46291
-ch 44851
-f 44256
-vo 44140
-da 43943
-it 43185
-k_ 43046
-on 43001
-ing 42549
-het 41683
-al 41629
-er_ 41342
-ver 40916
-oor 40483
-di 40464
-ti 39600
-oe 39522
-ro 38854
-ke 37225
-rd 36001
-at_ 35968
-een 35635
-ie_ 35579
-es 35561
-om 35530
-nt 34651
-op 33992
-ri 33957
-gen 33292
-we 33241
-l_ 32147
-ten 31913
-mi 31349
-ni 30987
-nde 30741
-ra 30544
-ng_ 30393
-aar 29998
-den 29952
-voo 29229
-voor 29218
-zi 28826
-men 28180
-ing_ 27498
-dat 26734
-eg 26688
-ei 26452
-ten_ 26098
-ed 25946
-la 25890
-ns 25857
-den_ 25619
-ste 25406
-ne 25253
-ze 24833
-em 24361
-id 23981
-wi 23128
-gen_ 23101
-aan 22945
-se 22665
-der 22496
-jk 22048
-ijk 22042
-ur 21715
-lij 21706
-ma 21375
-ui 21363
-eu 21109
-ig 20989
-co 20940
-rs 20817
-ht 20781
-cht 20751
-ik 20749
-ter 20595
-or_ 20528
-and 20223
-ev 20191
-j_ 20097
-ij_ 20085
-ta 19970
-sc 19939
-p_ 19842
-pe 19825
-na 19812
-oor_ 19774
-ll 19707
-jn 19589
-ijn 19588
-ere 18988
-eli 18952
-tie 18790
-ord 18668
-nie 18634
-eer 18591
-sch 18441
-lijk 18296
-de_ 18224
-mo 18032
-rde 17912
-tr 17839
-ek 17683
-un 17579
-to 17227
-wa 17057
-ers 16856
-nge 16644
-ss 16641
-ec 16589
-die 16194
-wo 16142
-ren 16025
-ar_ 15980
-lle 15979
-zo 15958
-aar_ 15804
-ent 15769
-si 15728
-it_ 15457
-ken 15329
-ag 15125
-ele 14932
-m_ 14928
-len 14892
-el_ 14864
-ol 14754
-pr 14732
-ijn_ 14701
-jn_ 14701
-ha 14690
-eb 14666
-zij 14141
-ez 13880
-mm 13871
-ens 13788
-nder 13788
-no 13778
-ov 13696
-eid 13612
-pa 13523
-wij 13390
-elij 13381
-uit 13297
-gr 13001
-ou 12980
-ove 12952
-bi 12941
-len_ 12882
-end 12873
-eme 12868
-ond 12826
-eur 12710
-il 12684
-hee 12652
-rk 12617
-iet 12513
-ef 12463
-am 12440
-le_ 12379
-ls 12237
-rt 12215
-wor 12126
-lan 11995
-ede 11994
-word 11875
-ic 11808
-sta 11800
-orde 11742
-ot 11711
-gel 11682
-over 11663
-ege 11587
-og 11516
-ak 11470
-te_ 11385
-erd 11384
-nt_ 11380
-nen 11376
-tel 11375
-ngen 11345
-do 11309
-met 11232
-ho 11209
-niet 11153
-zijn 11033
-ijk_ 10989
-jk_ 10989
-eer_ 10963
-mis 10918
-ken_ 10882
-moe 10881
-ren_ 10843
-iet_ 10804
-ts 10707
-ze_ 10626
-nen_ 10623
-iss 10582
-ati 10562
-oet 10486
-rg 10414
-com 10371
-ld 10266
-est 10264
-ac 10239
-inge 10167
-erk 10156
-rden 10129
-ns_ 10114
-a_ 10084
-ko 10075
-ande 10041
-rop 10039
-emen 10038
-maa 10038
-eze 9880
-mmi 9872
-ete 9815
-aat 9801
-omm 9800
-del 9754
-ad 9741
-ls_ 9724
-al_ 9683
-id_ 9629
-ok 9613
-ke_ 9601
-uro 9568
-moet 9560
-euro 9545
-nn 9534
-ment 9508
-rl 9499
-ga 9485
-tie_ 9442
-eri 9420
-ct 9408
-ds 9380
-sl 9342
-ang 9264
-nd_ 9250
-eren 9234
-comm 9227
-eve 9217
-ssi 9182
-uw 9169
-ven 9152
-ech 9130
-nte 9042
-rin 9016
-men_ 9004
-ope 8992
-eid_ 8966
-es_ 8924
-als 8917
-tu 8906
-rij 8862
-sp 8843
-urop 8838
-onde 8837
-dit 8793
-miss 8788
-sie 8743
-wer 8723
-se_ 8722
-rm 8700
-ommi 8669
-pro 8618
-stel 8571
-eel 8515
-ft 8480
-ich 8407
-ige 8403
-llen 8384
-tt 8351
-rz 8342
-st_ 8330
-as 8322
-lo 8281
-f_ 8255
-hte 8203
-mmis 8203
-chte 8202
-lin 8186
-echt 8172
-hi 8139
-vr 8134
-ka 8077
-gi 8066
-ag_ 8042
-ende 8010
-gev 7973
-eke 7934
-nne 7920
-daa 7904
-waa 7870
-ent_ 7804
-ter_ 7803
-ling 7758
-za 7749
-kt 7745
-ite 7723
-raa 7712
-ok_ 7691
-ame 7684
-u_ 7678
-ook 7661
-waar 7624
-ben 7621
-ien 7617
-hei 7604
-mij 7578
-du 7569
-ru 7561
-ft_ 7548
-bes 7521
-bel 7502
-ssie 7480
-tre 7475
-sie_ 7461
-heid 7453
-nk 7415
-issi 7377
-eld 7371
-eft 7364
-mee 7320
-re_ 7313
-tte 7285
-rd_ 7266
-dig 7262
-vi 7255
-kk 7224
-ver_ 7193
-so 7184
-dez 7155
-bij 7138
-dr 7128
-deze 7120
-ba 7098
-ijke 7082
-jke 7082
-con 7072
-eten 7046
-atie 6994
-tw 6979
-eft_ 6966
-heb 6911
-ep 6891
-nde_ 6880
-rope 6860
-ind 6852
-ring 6851
-eze_ 6806
-sen 6768
-ki 6755
-od 6710
-ate 6671
-af 6649
-us 6639
-oc 6633
-che 6605
-nnen 6581
-kel 6566
-rst 6528
-ge_ 6513
-ci 6471
-ul 6341
-ht_ 6338
-br 6331
-cht_ 6321
-sche 6308
-o_ 6256
-isc 6230
-eef 6223
-ap 6191
-lem 6174
-toe 6172
-par 6167
-all 6154
-dt 6134
-vers 6131
-str 6130
-ont 6123
-gro 6114
-min 6110
-der_ 6109
-pl 6100
-ant 6097
-vol 6094
-kom 6084
-eden 6075
-rb 6051
-dt_ 6024
-bet 5999
-of 5995
-mijn 5976
-land 5974
-een_ 5959
-erin 5915
-ger 5903
-ese 5899
-gs 5899
-rec 5891
-eeft 5867
-ens_ 5863
-even 5850
-ier 5840
-reg 5817
-alle 5808
-eel_ 5776
-sa 5767
-io 5752
-rv 5725
-jke_ 5697
-ot_ 5691
-fe 5684
-heer 5679
-po 5678
-nh 5666
-gd 5660
-ale 5617
-taa 5610
-geb 5599
-kt_ 5597
-ud 5589
-icht 5588
-rle 5585
-rs_ 5580
-werk 5558
-jd 5549
-ome 5549
-ven_ 5549
-ijd 5548
-bb 5547
-ach 5535
-isch 5524
-rge 5523
-ld_ 5517
-rzi 5503
-ell 5495
-wil 5490
-daar 5473
-bbe 5457
-acht 5456
-heef 5440
-leme 5385
-oete 5376
-ese_ 5375
-deli 5334
-nz 5326
-kke 5296
-omen 5286
-ebb 5281
-ebbe 5281
-doo 5274
-hebb 5272
-maar 5265
-nst 5251
-bben 5242
-ben_ 5222
-ig_ 5220
-lu 5217
-h_ 5191
-egen 5183
-ela 5164
-kin 5164
-ges 5161
-pes 5133
-orz 5122
-oorz 5118
-nden 5098
-dan 5089
-ard 5085
-ers_ 5080
-ch_ 5073
-door 5040
-bo 5037
-aat_ 5029
-sen_ 5015
-pen 5014
-ake 5000
-tot 4977
-opes 4961
-pese 4961
-aal 4948
-rn 4944
-eni 4930
-rech 4921
-sti 4887
-os 4879
-lang 4839
-oord 4836
-iti 4829
-dere 4804
-rste 4799
-bl 4793
-ons 4787
-lei 4783
-amen 4774
-cha 4771
-eld_ 4765
-aan_ 4745
-ce 4737
-zit 4722
-hu 4709
-orzi 4705
-elin 4695
-itt 4693
-ene 4683
-ouw 4679
-ngs 4677
-oet_ 4650
-oed 4626
-sla 4604
-arl 4600
-ku 4587
-nhe 4581
-aard 4569
-ia 4553
-ige_ 4541
-doe 4538
-nc 4538
-han 4523
-kan 4523
-scha 4517
-eken 4513
-zitt 4508
-tell 4507
-elen 4495
-ste_ 4467
-tter 4457
-age 4451
-itte 4449
-king 4444
-leg 4444
-aten 4437
-erv 4402
-wel 4400
-erde 4399
-go 4387
-kun 4387
-voe 4381
-ids 4368
-ari 4345
-oud 4344
-ort 4327
-erd_ 4262
-nse 4262
-naa 4252
-uni 4249
-tin 4231
-erg 4227
-rdt 4222
-gin 4219
-rdt_ 4219
-eit 4204
-rzit 4202
-ordt 4191
-staa 4191
-ree 4190
-ale_ 4188
-ide 4183
-arle 4172
-rlem 4169
-parl 4168
-w_ 4164
-eh 4156
-teg 4144
-ut 4137
-ieu 4125
-etr 4121
-cti 4099
-din 4099
-keli 4093
-ntw 4093
-unn 4083
-erst 4076
-org 4067
-ies 4060
-ere_ 4053
-ente 4050
-uc 4044
-og_ 4036
-lt 4034
-evo 4028
-ern 4027
-spr 4024
-unne 4009
-geli 4006
-rek 4006
-lg 4004
-aag 4002
-her 3997
-rege 3986
-ë 3980
-and_ 3979
-he_ 3971
-kunn 3965
-sse 3961
-bela 3956
-ew 3952
-che_ 3936
-orm 3933
-lee 3916
-gem 3906
-lag 3903
-ings 3882
-ting 3876
-fi 3874
-lk 3870
-este 3853
-gaa 3851
-laa 3850
-hie 3844
-rh 3842
-ien_ 3838
-leid 3838
-elan 3835
-tij 3832
-eerd 3831
-pp 3816
-nin 3813
-rag 3812
-enk 3799
-ran 3799
-ert 3776
-ied 3767
-oge 3766
-ele_ 3757
-ies_ 3755
-tat 3752
-ins 3749
-ding 3724
-rw 3723
-uwe 3721
-oen 3719
-ad_ 3716
-gele 3715
-wee 3710
-wat 3684
-inde 3659
-gee 3653
-ill 3644
-ili 3634
-hten 3633
-pen_ 3626
-im 3625
-ning 3619
-tg 3599
-nie_ 3593
-nze 3578
-art 3576
-zic 3573
-zich 3569
-nti 3566
-unie 3565
-bu 3547
-zou 3547
-ist 3543
-ude 3533
-nu 3528
-oer 3524
-zie 3509
-erh 3479
-era 3463
-egi 3457
-ming 3457
-au 3448
-ats 3446
-slag 3446
-nten 3444
-tei 3444
-il_ 3425
-chi 3419
-tro 3418
-rt_ 3412
-ange 3405
-verd 3400
-gd_ 3396
-int 3394
-vin 3393
-tra 3390
-aats 3371
-mer 3370
-hand 3368
-ade 3355
-nom 3354
-hap 3353
-aad 3348
-itei 3347
-chap 3346
-nat 3330
-egel 3326
-betr 3321
-is_ 3320
-ion 3318
-nog 3316
-ille 3315
-uu 3313
-ctie 3312
-erl 3312
-ndi 3292
-per 3289
-aak 3281
-eens 3280
-ect 3276
-eno 3275
-woo 3275
-edi 3274
-iek 3274
-rei 3270
-je 3266
-un_ 3263
-hou 3260
-gez 3243
-ron 3241
-uw_ 3241
-itie 3231
-erm 3230
-ed_ 3226
-ja 3225
-ker 3223
-ijnh 3219
-jnh 3219
-jnhe 3219
-ea 3218
-nhee 3218
-dien 3202
-ali 3196
-nem 3195
-pla 3194
-end_ 3193
-tege 3193
-nis 3187
-ees 3181
-ts_ 3178
-erw 3177
-teu 3168
-etre 3157
-lit 3150
-vor 3150
-rsc 3147
-nl 3142
-dra 3139
-ms 3139
-erb 3123
-schi 3120
-gra 3116
-agen 3113
-lge 3112
-app 3110
-vra 3109
-rsch 3108
-rou 3107
-esc 3104
-hier 3104
-igen 3100
-rke 3098
-res 3097
-aro 3095
-teit 3086
-esch 3080
-lid 3080
-ek_ 3074
-rde_ 3072
-act 3070
-ast 3070
-ris 3057
-tee 3055
-stat 3051
-tan 3050
-ona 3040
-ier_ 3039
-ging 3037
-pu 3033
-rouw 3031
-dst 3029
-mens 3026
-inte 3013
-zal 3012
-aaro 3011
-nv 3008
-rac 3005
-ber 3001
-tate 2998
-ff 2994
-aal_ 2991
-lli 2984
-geen 2973
-eva 2971
-ssen 2969
-lag_ 2967
-oude 2966
-rijk 2963
-best 2960
-tig 2960
-goe 2958
-raag 2950
-beg 2943
-gg 2943
-rdi 2942
-aken 2940
-nw 2937
-rot 2935
-uur 2935
-dd 2934
-goed 2934
-ks 2929
-ors 2921
-cr 2920
-onz 2920
-meer 2918
-zien 2915
-oek 2902
-bele 2900
-ië 2897
-els 2895
-in_ 2894
-fr 2891
-rsl 2890
-md 2889
-onze 2877
-erz 2872
-woor 2871
-nke 2867
-um 2865
-houd 2861
-laat 2861
-rte 2860
-aad_ 2859
-erke 2859
-gri 2854
-enin 2853
-kome 2853
-ric 2850
-hter 2846
-naar 2843
-ir 2834
-tge 2834
-dee 2831
-me_ 2831
-nter 2827
-oors 2822
-ou_ 2819
-uid 2818
-rsla 2811
-ersl 2807
-stan 2801
-ndel 2796
-bie 2791
-rme 2788
-ee_ 2785
-rat 2785
-nze_ 2784
-sten 2780
-elei 2778
-lie 2775
-are 2772
-pre 2762
-dem 2761
-kr 2754
-ijz 2745
-jz 2745
-tem 2742
-mst 2738
-euw 2737
-tio 2735
-ure 2732
-rich 2730
-elle 2729
-rui 2728
-tijd 2727
-tion 2723
-ersc 2721
-ties 2716
-olg 2712
-volg 2707
-oel 2704
-vaa 2700
-aag_ 2699
-unt 2698
-bre 2697
-oms 2697
-om_ 2696
-ob 2695
-ang_ 2694
-ank 2693
-ote 2693
-vere 2692
-rki 2681
-idst 2679
-nda 2673
-raad 2660
-rmi 2653
-twi 2653
-geno 2652
-bied 2648
-zon 2645
-grot 2640
-ikk 2640
-lf 2639
-tal 2637
-uite 2636
-nal 2635
-ema 2630
-kkel 2624
-gest 2623
-ak_ 2622
-zu 2622
-neme 2621
-ai 2613
-ich_ 2605
-dige 2604
-ein 2604
-geme 2593
-iten 2591
-oeg 2589
-uden 2586
-y 2583
-val 2577
-ne_ 2575
-red 2575
-ieuw 2573
-rom 2573
-nieu 2570
-ntie 2568
-rbe 2567
-ero 2565
-hoo 2559
-twe 2556
-mog 2550
-vro 2549
-zel 2548
-elli 2544
-lde 2541
-ontw 2534
-eit_ 2532
-dde 2528
+# NgramProfile generated at Tue May 31 02:32:58 CEST 2005 for Nutch Language Identification
+e 27720686
+n 14467176
+i 10359021
+a 10312655
+t 9689526
+r 9067573
+o 8596321
+d 8367518
+s 5697679
+l 5248236
+g 4652890
+v 3964971
+m 3850200
+h 3279640
+k 3113260
+u 2749917
+p 2503579
+b 2174147
+c 2103635
+w 2057406
+j 1912009
+z 1792339
+f 979684
+ë 85436
+é 68624
+y 68038
+x 45043
+q 31187
+ö 13432
+ï 11424
+ó 8929
+è 7181
+à6914
+á 3188
+ê 3174
+ü 2793
+à2579
+ä 1864
+ç 747
+æ 683
+ô 573
+ò 496
+ñ 379
+ú 352
+î 340
+û 329
+ù 275
+â 260
+ø 251
+ã 235
+ß 226
+Ã¥ 88
+ì 38
+º 19
+õ 9
+ý 7
+ð 2
+þ 1
+n_ 7473406
+en 6505690
+e_ 5833036
+de 4238154
+_d 4077828
+t_ 4012679
+er 3644277
+an 2763578
+_v 2752216
+te 2443507
+ge 2239512
+_e 2102755
+in 2097571
+r_ 2018776
+et 1989393
+he 1838480
+ie 1825675
+ee 1798004
+_h 1788161
+ij 1722796
+aa 1720243
+el 1717872
+_i 1664674
+_o 1643352
+s_ 1590080
+or 1519804
+_m 1413751
+me 1361665
+at 1335248
+_w 1332258
+st 1321251
+va 1320358
+re 1314441
+ve 1273399
+oo 1267864
+ng 1266557
+le 1230481
+_b 1204232
+nd 1170327
+_a 1147079
+d_ 1142598
+g_ 1097175
+_t 1091205
+be 1086234
+_g 1080289
+ar 1053247
+is 1021257
+li 1020724
+vo 970554
+da 969981
+_z 966971
+on 962342
+it 961847
+ch 953009
+k_ 929446
+al 909032
+ti 897901
+ke 890308
+_s 876392
+_n 868529
+di 859226
+ro 845533
+oe 842930
+_p 839824
+es 812562
+rd 774895
+om 773406
+nt 760857
+ri 748216
+op 744912
+we 729302
+l_ 705248
+p_ 698097
+ni 669537
+ra 668219
+mi 664654
+zi 645721
+la 639214
+id 624047
+ei 599553
+ns 583955
+eg 574623
+ne 561671
+ed 561114
+em 540180
+ze 536512
+pe 533945
+na 524155
+se 498358
+wi 482204
+_l 482141
+_k 478829
+rs 474756
+jk 473782
+ur 473371
+_c 472643
+ma 471615
+ui 460247
+_r 458499
+ig 457147
+co 455830
+eu 452589
+ev 444866
+ta 444783
+sc 437120
+ll 434529
+ik 429695
+j_ 423144
+ht 417265
+jn 415415
+ek 395516
+to 393986
+mo 388679
+tr 385682
+un 380896
+_u 379407
+ag 375649
+wa 369277
+am 368071
+ss 365718
+ec 349469
+zo 349182
+si 344981
+ak 344641
+wo 344051
+m_ 334983
+ha 331798
+eb 325896
+pr 323694
+ol 316455
+pa 310362
+ez 304876
+no 303942
+ou 298241
+ov 295093
+mm 290860
+gr 284845
+sp 284702
+rk 283036
+il 280187
+bi 277364
+ef 275299
+rt 272853
+ot 263862
+ic 260174
+ls 256897
+og 249987
+do 246834
+a_ 246340
+u_ 245429
+ho 240142
+sl 224225
+ts 223808
+ld 223740
+ad 221915
+ko 220738
+rg 219911
+ac 218594
+ga 217344
+rz 210926
+ok 210421
+nn 208884
+tt 207396
+ct 206235
+ds 202903
+as 200668
+rl 199425
+ft 193879
+lo 193314
+tu 189498
+uw 185773
+rm 184508
+_f 181951
+f_ 174968
+gi 173496
+za 172998
+vr 172828
+ru 172643
+hi 171991
+ka 168968
+kt 167734
+du 167309
+vi 161875
+us 161212
+ea 160609
+nk 158434
+kk 157035
+ba 155740
+dr 155708
+ap 155143
+ep 153776
+tw 149652
+so 149229
+ki 144826
+br 144471
+oc 143461
+od 141889
+ul 137997
+po 136241
+pl 133259
+rb 133116
+ci 131969
+dt 131886
+af 131223
+io 130762
+o_ 129955
+sa 129798
+of 129675
+gd 127448
+fe 126802
+jd 123608
+bb 122908
+_j 122872
+gs 121853
+rv 121306
+h_ 119250
+nh 119149
+nz 118933
+ce 117072
+ud 114660
+lu 113615
+bo 111791
+bl 111681
+os 106365
+rn 105455
+ia 103852
+hu 97892
+ku 96984
+pp 95055
+ut 94583
+ew 93560
+eh 93037
+nc 92969
+w_ 90747
+go 90171
+lt 89880
+lg 89671
+ua 89071
+au 86252
+fi 85595
+rw 84311
+im 82852
+tg 81553
+nu 79717
+rh 79601
+uc 79372
+bu 79272
+ir 79012
+je 77776
+lk 74149
+ai 73724
+nv 73443
+ms 72281
+ja 70761
+nl 70411
+gu 70129
+cr 69943
+uu 69357
+ks 68010
+ff 67463
+nw 64574
+fr 64247
+pu 63965
+i_ 63829
+kr 63651
+dd 63536
+ob 62720
+gg 61609
+jz 61560
+ië 60611
+su 60225
+rr 59688
+md 58137
+lf 57850
+um 55958
+fo 53301
+kl 53000
+gt 52951
+gh 52786
+zu 52628
+rp 52135
+uk 51771
+cu 51069
+ca 49528
+kw 49122
+mu 48053
+pt 47658
+iv 47508
+sm 47422
+oa 46186
+tv 44851
+b_ 44076
+ju 43224
+mp 42831
+jv 42781
+nf 42012
+mt 41987
+nb 41833
+th 41194
+kh 40231
+ab 39318
+jf 39136
+ug 37451
+sb 37370
+tl 37232
+pi 37173
+dh 36385
+tb 36224
+ue 36006
+fd 35886
+fg 35387
+av 34715
+fs 33949
+if 33231
+mb 33019
+ub 32645
+sv 32386
+pg 31584
+js 31042
+ex 30382
+vl 30199
+hr 30129
+qu 29911
+ël 29081
+jg 28573
+db 28476
+nr 27569
+nm 27512
+jo 27137
+sn 26998
+ip 25338
+fa 24763
+oi 24120
+eo 23288
+ps 23096
+lp 22339
+tz 22148
+dz 21946
+ys 21687
+ë_ 21685
+ib 21601
+dp 21592
+sg 21368
+fu 21357
+sy 20307
+eë 20235
+zw 20083
+ën 19437
+bs 19405
+sh 18799
+sr 18752
+dw 18526
+fl 18517
+hn 17451
+ow 17443
+cl 17199
+kg 16773
+np 16747
+sd 16487
+_é 16025
+lv 15881
+dv 15711
+oj 15601
+lj 15507
+cc 15368
+gl 15266
+sk 15203
+dg 14717
+td 14513
+y_ 14459
+rc 14264
+jl 14233
+vu 14178
+_q 13946
+én 13753
+é_ 13686
+kb 13457
+c_ 13100
+tn 12950
+sw 12523
+pm 12211
+xt 11866
+té 11584
+lm 11557
+oz 11403
+éé 11320
+tm 11265
+kz 10898
+pn 10604
+jp 10499
+pz 10360
+lb 10358
+jh 10003
+fh 9876
+z_ 9819
+rf 9808
+uz 9801
+kn 9672
+dk 9671
+ln 9565
+fw 9532
+gn 9483
+bt 9451
+xi 9302
+uv 9199
+iz 8683
+up 8604
+ër 8288
+pv 8234
+oh 8211
+gm 8114
+mh 8004
+tk 7968
+jt 7904
+ck 7902
+eï 7831
+ïn 7733
+pb 7561
+ör 7525
+sz 7524
+xp 7520
+az 7486
+sj 7443
+mv 7343
+dm 7196
+gv 7070
+x_ 6915
+wb 6819
+à_ 6774
+oö 6761
+ly 6610
+lh 6526
+ré 6489
+tj 6478
+wd 6391
+wu 6297
+fv 6227
+yp 6051
+_à6035
+pd 5980
+gb 5636
+lz 5624
+iu 5619
+ux 5552
+v_ 5515
+mg 5500
+és 5337
+ph 5283
+ii 5232
+cy 5168
+eq 4973
+tp 4881
+ey 4875
+xe 4823
+sf 4813
+fz 4581
+yn 4545
+nj 4541
+gk 4503
+jw 4478
+dé 4363
+lw 4338
+aë 4075
+lr 3992
+ér 3903
+ws 3840
+hl 3808
+ay 3772
+vn 3770
+iq 3748
+ah 3727
+ée 3622
+wt 3577
+yo 3489
+vs 3461
+óó 3411
+fk 3399
+ór 3395
+vó 3384
+uo 3363
+gw 3276
+gp 3224
+fb 3210
+ry 3135
+ae 3090
+ax 2980
+ty 2976
+ét 2897
+ox 2802
+oy 2725
+ëe 2708
+hy 2707
+èr 2703
+ym 2702
+éc 2679
+jb 2671
+ye 2666
+mc 2646
+pé 2594
+by 2584
+cs 2516
+rj 2508
+ej 2474
+ml 2429
+aï 2427
+wh 2417
+ëi 2400
+iè 2395
+ao 2386
+hm 2381
+dy 2346
+êt 2328
+mé 2325
+lc 2306
+wr 2297
+hz 2286
+kp 2275
+bj 2263
+yr 2259
+mk 2232
+km 2207
+ky 2187
+tc 2150
+mz 2122
+ya 2109
+yc 2109
+wk 2046
+lé 2020
+_y 1998
+dl 1922
+ég 1909
+dj 1880
+yl 1877
+mr 1875
+né 1857
+mw 1832
+xa 1816
+gz 1799
+sé 1795
+uf 1788
+wp 1788
+xc 1782
+gc 1763
+kj 1754
+vé 1717
+pk 1684
+aw 1663
+zz 1645
+kd 1634
+aj 1615
+él 1612
+rö 1593
+cq 1567
+ál 1548
+cn 1517
+cb 1492
+fn 1488
+ón 1378
+pw 1367
+dn 1366
+év 1361
+rè 1342
+éd 1313
+ji 1309
+my 1307
+nq 1300
+ès 1279
+ïs 1271
+wl 1188
+üb 1166
+ró 1145
+wg 1121
+ös 1120
+ix 1118
+yt 1113
+án 1090
+ÃÂn 1086
+mn 1082
+fm 1076
+ép 1070
+nè 1040
+sq 1039
+kv 1014
+èv 1010
+ém 1009
+zá 1007
+vb 1003
+mf 988
+hé 986
+öm 986
+gy 969
+fp 968
+iw 968
+tf 968
+uê 958
+wm 946
+fy 943
+_x 937
+jö 916
+bw 915
+än 900
+uy 899
+ié 895
+bö 888
+èm 878
+jm 876
+ny 860
+rü 857
+ué 855
+pj 848
+lè 847
+yi 821
+bn 820
+aq 816
+rq 800
+_ê 797
+fj 784
+pc 778
+uh 770
+vp 763
+bv 762
+rà749
+ÃÂa 744
+gö 740
+uï 736
+qv 732
+df 715
+fé 713
+bp 710
+gé 699
+cé 688
+eé 677
+uj 666
+ih 662
+py 655
+dc 654
+éf 650
+vj 644
+éa 642
+êm 638
+öt 633
+ëv 623
+uq 603
+wy 603
+bé 599
+wc 596
+ïr 583
+wz 577
+mê 573
+zq 564
+_á 558
+ön 537
+ëx 532
+ït 528
+mü 521
+öd 518
+tà517
+dq 509
+pä 496
+bc 488
+cm 482
+oë 481
+cà480
+èg 478
+lq 474
+ïm 467
+üh 465
+vc 456
+ná 455
+yb 453
+éb 446
+hw 443
+hö 442
+yg 434
+æk 434
+_ü 430
+bæ 429
+ww 425
+öp 415
+oï 413
+gf 409
+sá 408
+bh 398
+ça 394
+éo 384
+ül 384
+hä 380
+yd 380
+dà373
+éj 373
+zn 369
+hs 363
+dü 361
+fc 361
+q_ 352
+éq 352
+_ö 347
+ó_ 347
+sö 341
+zj 341
+kf 333
+rê 323
+ïe 323
+ün 319
+öl 316
+iö 302
+jà298
+bd 297
+là297
+aî 294
+rô 293
+tê 291
+tè 288
+är 287
+ôl 287
+dö 285
+gj 284
+kx 283
+má 282
+fä 276
+aç 274
+sò 274
+òl 273
+pf 272
+ÃÂe 272
+ÃÂ_ 270
+öc 269
+ù_ 263
+bk 262
+öh 262
+où 257
+ët 252
+oq 248
+äm 246
+jæ 239
+zb 239
+kä 236
+só 236
+ög 236
+cè 233
+kc 233
+wn 231
+ão 231
+ær 231
+vk 229
+xx 229
+hc 228
+cf 227
+ço 227
+lö 225
+jc 223
+zh 223
+ør 220
+èn 217
+wv 216
+öw 216
+öö 216
+sà214
+zs 208
+cd 205
+ît 205
+ïd 204
+ût 202
+ún 201
+vd 199
+zf 199
+èl 197
+añ 196
+pö 196
+oû 185
+dè 179
+cú 177
+jr 177
+éu 176
+ës 175
+üm 175
+hd 173
+èt 173
+yu 172
+pè 171
+uü 170
+ôt 170
+yk 168
+cp 167
+nç 167
+ß_ 166
+hh 165
+á_ 161
+jø 157
+qa 157
+_ó 156
+ò_ 156
+wé 155
+gü 154
+ló 153
+ár 152
+cò 151
+rç 151
+aß 150
+zl 145
+ño 145
+hj 144
+yh 144
+xo 143
+óp 142
+ëf 137
+hè 136
+ñe 135
+xf 133
+âc 131
+lä 128
+mè 126
+hk 124
+ö_ 124
+tx 123
+èd 122
+pê 119
+êc 118
+în 117
+tà112
+yy 109
+zó 109
+iñ 107
+dá 106
+nä 106
+hb 105
+ür 105
+äf 103
+vä 101
+kq 98
+iã 97
+vv 95
+hô 93
+èc 91
+üs 91
+xv 90
+bz 88
+äy 87
+ïb 87
+iy 86
+äl 86
+hp 84
+nö 84
+xé 83
+cg 81
+ió 80
+wf 80
+rà79
+tô 79
+át 79
+wj 77
+zr 77
+rx 75
+sä 75
+wè 75
+óf 75
+hü 73
+xy 73
+às 73
+ä_ 73
+tá 71
+yv 71
+ú_ 70
+bm 69
+ña 69
+_è 67
+tq 67
+sè 66
+xh 66
+xu 66
+ïl 66
+ât 65
+ûr 65
+cô 63
+sû 63
+ôm 62
+nú 61
+là59
+rã 58
+vè 58
+gè 57
+tâ 57
+yé 57
+gê 56
+ên 56
+çu 55
+bâ 54
+dû 54
+ï_ 54
+cj 53
+mã 53
+ÃÂg 53
+râ 51
+bg 50
+lü 50
+oñ 50
+tó 50
+eç 49
+û_ 49
+yw 48
+rá 47
+aé 46
+hf 46
+kö 46
+éh 46
+cv 45
+mà45
+cw 44
+áá 44
+óm 44
+kó 42
+yá 41
+ïv 41
+_ò 39
+òf 39
+lá 38
+uç 37
+uè 37
+vg 37
+yf 37
+zk 37
+zé 37
+éi 37
+ôn 37
+mó 36
+Ã¥_ 35
+öv 35
+çi 34
+uà33
+zc 33
+_ç 32
+xq 32
+óg 32
+eå 31
+ÃÂj 31
+gø 30
+zg 30
+zy 30
+ái 30
+ëm 29
+aà28
+fè 28
+nó 28
+oî 28
+üt 28
+eß 27
+mö 27
+vê 27
+ßl 27
+ÃÂs 27
+_â 26
+uß 26
+ÃÂt 26
+_Ã¥ 25
+fó 25
+yz 25
+wü 24
+ëd 24
+óe 24
+sø 23
+ßb 23
+ók 23
+_ì 22
+_à22
+jü 22
+ké 22
+qi 22
+âg 22
+çk 22
+ÃÂo 22
+rú 21
+àt 21
+dà20
+jú 20
+nà20
+zè 20
+ñi 20
+øl 20
+fü 19
+mø 19
+ác 19
+ás 19
+â_ 19
+úc 19
+aâ 18
+eü 18
+fá 18
+tü 18
+vy 18
+xw 18
+zm 18
+äc 18
+Ã¥s 18
+éz 18
+ïc 18
+úa 18
+ús 18
+üd 18
+_º 17
+mà17
+en_ 4875445
+de_ 2498895
+_de 2447805
+an_ 1542117
+et_ 1517071
+_he 1366704
+_va 1159558
+er_ 1156135
+van 1151452
+het 920509
+ing 911867
+oor 890787
+ver 888523
+_in 815295
+_ge 787994
+at_ 785416
+_da 781128
+een 772442
+ie_ 770992
+_be 770734
+_en 747339
+_vo 745542
+gen 719173
+ten 674122
+nde 671841
+ng_ 657921
+voo 649952
+den 649681
+aar 635904
+_ve 622761
+_ee 611047
+men 608635
+te_ 603286
+_te 597352
+dat 590108
+in_ 586239
+ste 542157
+_di 513096
+_me 504091
+aan 496435
+der 489813
+ijk 473350
+ter 467927
+lij 462148
+and 443286
+_op 440540
+is_ 438291
+or_ 434406
+ij_ 422160
+tie 420719
+ere 418694
+cht 416697
+ijn 415386
+_we 412162
+eer 408300
+_on 406890
+eli 406123
+ord 403216
+sch 402275
+ers 381896
+rde 381806
+nie 381414
+_zi 379955
+_is 366863
+_co 366844
+nge 366399
+_wi 358304
+ent 358042
+_aa 354574
+die 350603
+lle 347821
+_al 347702
+ren 346837
+op_ 344079
+ar_ 339604
+ken 338424
+el_ 323408
+it_ 323128
+_mo 321717
+ele 317582
+lan 315855
+_st 315437
+len 312962
+jn_ 308839
+id_ 307834
+eid 304458
+ens 304320
+ik_ 299222
+zij 298903
+_na 296130
+_ma 291284
+uit 287538
+_ni 284859
+eme 284619
+ond 284202
+_wa 282691
+wij 282541
+hee 280934
+_ik 280835
+eur 280788
+ove 280525
+_mi 279165
+end 274352
+_wo 271374
+le_ 268582
+ame 265409
+_to 264844
+wor 260964
+_p_ 260674
+nt_ 260198
+al_ 259284
+iet 258906
+ang 258538
+ede 256291
+sta 255152
+_zo 255006
+gel 251706
+ze_ 250966
+ege 248565
+erd 245596
+ati 244885
+met 243911
+_re 241855
+tel 241554
+nen 241127
+jk_ 240154
+om_ 237147
+_om 237093
+ns_ 233712
+mis 233092
+_eu 230034
+erk 229875
+es_ 226529
+est 225575
+iss 222118
+_ov 221820
+moe 220866
+rop 220793
+com 220143
+_la 218964
+_er 218731
+oet 214279
+del 211071
+maa 210911
+eve 209755
+uro 209059
+eze 207942
+ven 206821
+nd_ 206124
+ke_ 205584
+ls_ 205189
+omm 203299
+eri 203216
+ake 202452
+aat 202357
+_oo 202322
+ete 202290
+mmi 202269
+wer 198038
+ope 197907
+se_ 197677
+ssi 196722
+rij 193969
+rin 193875
+_ui 193612
+nte 191256
+_do 190509
+als 189692
+_pr 187890
+pro 187205
+sie 186185
+ge_ 183255
+st_ 182337
+ich 181530
+tte 179156
+eel 179098
+ige 178104
+ech 177838
+ite 176289
+_bi 174852
+ag_ 173824
+lin 172751
+eke 172639
+daa 172308
+dit 171453
+ft_ 171358
+raa 170118
+gev 169327
+waa 168740
+re_ 168284
+hei 168262
+ien 167416
+nne 167262
+ok_ 166669
+eft 166208
+tre 166092
+ben 166075
+ook 165708
+rd_ 165646
+_ze 164825
+bel 163367
+me_ 161600
+eld 160922
+_pa 160729
+mee 160340
+ker 160086
+mij 160067
+bes 158162
+_sp 158113
+con 158098
+bij 155039
+_no 154643
+heb 154282
+hte 153707
+jke 152217
+dig 151526
+che 150298
+dez 146851
+nam 145906
+rst 145455
+ind 144767
+sen 144050
+rzi 143133
+age 142201
+isc 141948
+spe 141332
+ate 140627
+we_ 140447
+eef 139962
+lem 139670
+ht_ 139398
+par 138717
+toe 135902
+all 135727
+_ho 134088
+kel 134039
+bet 134028
+orz 132814
+kom 131994
+vol 131795
+ant 131342
+ont 131296
+ger 130961
+gro 130145
+ot_ 129349
+str 129137
+min 129079
+dt_ 129022
+rs_ 126553
+itt 126341
+ier 125385
+_ka 124998
+ese 124837
+zit 124125
+ale 123721
+ijd 123575
+geb 123259
+_gr 122972
+ell 121683
+kt_ 121243
+ld_ 121199
+bbe 121146
+ach 118137
+rle 117892
+ebb 117855
+ome 116482
+sti 116415
+dan 115967
+_li 115754
+cha 115261
+ela 115094
+sla 114944
+pen 114308
+_vr 114279
+_ha 113918
+reg 113887
+doo 113847
+wil 113766
+rge 113175
+nst 113055
+taa 112799
+ch_ 112304
+pes 111855
+rec 111212
+ig_ 110016
+tot 109806
+kke 109786
+eni 108710
+ges 108192
+ard 106718
+ene 106592
+kin 106545
+ons 106410
+_ra 105421
+lei 105201
+_id 104967
+aal 103696
+iti 103206
+ouw 102135
+_za 100850
+leg 99800
+nhe 98913
+han 98555
+wel 98370
+arl 97722
+_le 96683
+kan 96569
+ort 96222
+oud 96026
+lag 95853
+sse 95805
+oed 95398
+voe 95009
+ad_ 94689
+_ko 94557
+ngs 94505
+eit 94371
+kun 94044
+ide 93462
+naa 93412
+etr 93326
+he_ 93176
+tin 93154
+nse 93090
+pea 92765
+uni 92501
+ree 92350
+_hi 92261
+cti 92211
+doe 92169
+_ku 92065
+ari 91728
+gin 90808
+ids 90743
+rdt 90737
+_ec 90736
+erg 90474
+teg 90447
+og_ 90377
+eak 90283
+erv 90003
+_an 89723
+ies 88569
+tij 88499
+_un 88370
+_af 88186
+din 87468
+ern 87057
+unn 87021
+rek 86913
+evo 86834
+uw_ 86626
+tat 86477
+_du 86045
+aad 85575
+wee 85487
+org 85128
+gem 84985
+nin 84886
+ist 84659
+orm 84144
+ion 83787
+lee 83733
+ran 83621
+ntw 83410
+hap 83177
+ert 83011
+ins 82864
+gaa 82789
+oge 82586
+ili 82257
+laa 82018
+aag 81578
+art 81328
+her 80965
+of_ 80715
+ill 80116
+ied 79817
+spr 79798
+ieu 79776
+zie 79773
+nti 79449
+gee 78811
+_vi 78663
+hie 78508
+enk 78391
+zic 77984
+zou 77453
+gd_ 77073
+_ga 77053
+gez 76917
+_hu 76905
+oen 76897
+tei 76064
+era 75898
+oer 75885
+tra 75321
+rag 75125
+res 75037
+nat 74879
+rei 74863
+nze 74835
+nom 74793
+iek 74726
+oek 74060
+app 73905
+il_ 73742
+edi 73423
+nis 73288
+ect 73119
+ude 72959
+wat 72863
+lit 72822
+ber 72809
+rt_ 72525
+nog 72474
+rsl 72312
+erh 72233
+mer 72166
+_of 72146
+ts_ 71391
+_po 71197
+chi 71194
+hou 71071
+ast 70922
+rke 70897
+act 70573
+ali 70503
+ees 70188
+int 70119
+ed_ 70048
+rsc 70036
+erz 69873
+tio 69848
+uwe 69640
+vin 69625
+tan 69568
+un_ 69501
+per 69223
+erl 68813
+ek_ 68661
+erw 68654
+ats 68476
+lge 68392
+ors 68220
+nem 68219
+_so 68206
+aak 67640
+ndi 67491
+egi 67481
+rou 67440
+rat 67169
+woo 67139
+gri 67098
+zal 67049
+_u_ 66942
+erb 66880
+eno 66767
+tig 66675
+teu 66579
+lli 66560
+jnh 66521
+rot 66445
+erm 66165
+rte 65967
+ris 65837
+ade 65836
+tro 65745
+lid 65627
+tee 65599
+beg 65593
+aro 64977
+_go 64914
+gra 64450
+ona 64326
+dem 64050
+_bu 63973
+pla 63935
+dra 63821
+pre 63701
+ron 63345
+rac 63276
+vor 63269
+_pl 63133
+esc 63040
+ou_ 62987
+tge 62975
+mst 62842
+ne_ 62571
+zen 62301
+oms 62196
+rui 62029
+goe 61970
+dee 61796
+ans 61731
+bre 61602
+ijz 61557
+red 61550
+tem 61146
+ric 61143
+eva 61135
+ank 60710
+ee_ 60508
+rme 60344
+vra 60065
+onz 59907
+uur 59696
+dst 59567
+bie 59523
+_sc 59400
+_ne 59339
+olg 59218
+nke 58931
+nda 58831
+_nu 58705
+rdi 58676
+zon 58660
+ote 58446
+eed 58076
+twe 57934
+ein 57841
+rki 57827
+are 57539
+_ja 57413
+rbe 57388
+mog 57039
+nal 57023
+_am 56984
+ur_ 56917
+unt 56915
+tal 56837
+uid 56835
+gew 56791
+ure 56632
+els 56535
+ero 56453
+dde 56407
+vro 56269
+idi 56132
+ds_ 55845
+omi 55679
+rvo 55543
+_sa 55531
+lig 55493
+ak_ 55446
+ezi 55349
+bli 55188
+ged 54852
+ema 54507
+oel 54408
+roe 54395
+lie 54179
+ppe 54177
+ebr 53985
+bev 53896
+oeg 53803
+_ac 53626
+us_ 53599
+euw 53442
+lde 53360
+gge 53355
+zak 53293
+zel 53222
+vaa 53200
+eco 53184
+oli 53128
+nu_ 53048
+twi 52957
+esl 52648
+hoo 52602
+one 52518
+_ei 52399
+ini 52187
+elf 52138
+ngr 51999
+ega 51879
+rom 51803
+zeg 51612
+ikk 51519
+igd 51427
+rmi 51351
+tst 51280
+oe_ 50970
+ffe 50908
+rie 50681
+ani 50664
+_ri 50603
+_zu 50495
+val 50425
+wet 50373
+lis 50355
+vee 50205
+mid 50043
+ner 50027
+nee 49807
+pel 49753
+gua 49696
+air 49646
+egr 49623
+ngu 49621
+_fr 49348
+tis 49304
+hoe 49271
+evr 48913
+eng 48908
+uss 48890
+ire 48883
+uag 48868
+idd 48799
+oll 48733
+enl 48597
+ewe 48499
+beh 48445
+gan 48240
+sin 48180
+epa 48120
+rli 48023
+_br 48019
+_s_ 47864
+tor 47862
+nsc 47860
+enw 47828
+ina 47770
+rkt 47745
+as_ 47742
+man 47517
+nta 47486
+lic 47360
+ull 47184
+_tw 47113
+lat 46902
+on_ 46889
+wen 46872
+iev 46822
+_ti 46671
+rob 46664
+ref 46560
+igh 46506
+erp 46428
+sel 46421
+_bl 46292
+haa 46271
+rti 46228
+rit 46200
+dui 46112
+ghe 46057
+egd 46044
+mil 45992
+egg 45955
+em_ 45753
+nig 45595
+nds 45580
+ono 45523
+inn 45517
+pun 45482
+ori 45440
+fen 45251
+ser 45159
+_bo 44993
+ble 44928
+_pe 44679
+lev 44637
+tri 44588
+ntr 44503
+_sl 44398
+eem 44100
+_dr 43853
+hun 43808
+rga 43691
+ap_ 43653
+gt_ 43598
+_tu 43595
+oal 43468
+zo_ 43358
+sam 43337
+jd_ 43296
+pol 43255
+ann 43214
+ral 43174
+bed 43096
+tai 43029
+zoa 42949
+rne 42947
+its 42921
+akt 42880
+pee 42846
+zul 42804
+ijv 42767
+eun 42656
+_kr 42523
+ett 42473
+tek 42365
+_ba 42351
+opa 42292
+lui 42199
+eil 42150
+por 42010
+bur 41893
+fin 41893
+_tr 41860
+rva 41739
+wik 41655
+fra 41644
+mat 41640
+tuu 41623
+mak 41610
+_ar 41278
+nwe 41196
+pa_ 41183
+sit 41057
+eko 40986
+mar 40930
+led 40857
+geh 40811
+dus 40722
+dri 40616
+ekk 40604
+enh 40552
+hed 40384
+ssa 40370
+cia 40217
+zoe 40166
+elk 40041
+mme 39920
+ebi 39874
+itg 39746
+zet 39740
+loo 39713
+ise 39542
+ial 39460
+bep 39412
+eff 39394
+rzo 39351
+jaa 39340
+uct 39152
+ijf 39135
+oep 39055
+obl 39016
+_ie 38871
+ve_ 38395
+ong 38027
+hel 37903
+khe 37762
+mev 37546
+jkh 37459
+zee 37424
+esp 37351
+ma_ 37250
+bru 37095
+hti 36994
+ler 36931
+rhe 36895
+roo 36868
+_kw 36867
+_fi 36714
+pri 36665
+urg 36608
+epe 36606
+ram 36603
+_el 36575
+_ju 36504
+slu 36372
+tus 36337
+_ev 36289
+cte 36168
+nci 36069
+pas 36069
+gde 36014
+emm 36008
+roc 35865
+weg 35833
+anc 35767
+edr 35633
+evi 35552
+eds 35374
+ust 35359
+jde 35113
+oce 35088
+rel 35032
+nli 34932
+ara 34908
+ass 34802
+eho 34796
+kri 34748
+je_ 34651
+_si 34603
+ost 34555
+ban 34457
+_se 34376
+arb 34216
+kki 34197
+zin 34144
+na_ 34095
+afg 34074
+oog 34030
+eig 33894
+rna 33670
+col 33664
+vri 33661
+gek 33592
+_ke 33591
+nko 33430
+rak 33269
+_ro 33193
+eg_ 33159
+pec 33079
+mt_ 33030
+rwe 33022
+noo 32956
+baa 32938
+soc 32858
+ike 32776
+och 32672
+ief 32660
+ore 32630
+eb_ 32557
+oci 32548
+hts 32478
+for 32431
+two 32384
+uis 32344
+hij 32332
+uik 32316
+err 32189
+emo 32171
+ef_ 32111
+tru 32056
+ije 32053
+elo 32044
+bou 31984
+nan 31945
+rol 31941
+wan 31875
+rok 31763
+ine 31758
+arm 31706
+onc 31647
+was 31574
+aut 31530
+sol 31446
+amm 31426
+itu 31382
+rod 31354
+rbi 31261
+rre 31252
+zaa 31242
+ume 31073
+eba 31066
+nk_ 31046
+fge 31043
+lt_ 31031
+ijs 31023
+ark 31007
+jze 30990
+emi 30862
+ena 30860
+bin 30815
+_ta 30785
+ogr 30783
+zor 30747
+ult 30599
+cen 30505
+eu_ 30497
+pra 30434
+slo 30234
+opg 30212
+ode 30180
+orb 30168
+inz 30162
+odi 30013
+rha 29944
+had 29856
+rog 29829
+igi 29791
+_fe 29690
+spa 29602
+_pu 29596
+rma 29581
+lot 29556
+pge 29347
+bee 29340
+gie 29293
+stu 29284
+omd 29184
+eha 29148
+deb 29142
+med 29034
+ets 28937
+oti 28919
+olk 28915
+les 28805
+jve 28636
+atr 28571
+ijg 28566
+dru 28525
+mda 28508
+oei 28504
+uti 28497
+rk_ 28459
+sar 28446
+nel 28290
+mel 28264
+dhe 28249
+eda 28246
+rap 28195
+odu 28159
+oot 28081
+vas 28077
+_or 28012
+chr 27813
+noe 27756
+mma 27744
+geg 27717
+dis 27649
+elt 27601
+ald 27592
+paa 27535
+duc 27528
+ood 27452
+ct_ 27337
+sto 27310
+arv 27305
+rig 27222
+eta 27201
+ive 27145
+nni 27053
+ga_ 27047
+ebe 27026
+ita 27012
+rdr 26905
+net 26903
+_kl 26792
+dse 26772
+oop 26708
+get 26691
+uat 26669
+vis 26610
+bat 26514
+oon 26450
+mon 26266
+_lo 26255
+alt 26176
+kwe 26126
+akk 26118
+ehe 26036
+atu 26029
+nit 26008
+lke 25961
+fer 25709
+zig 25641
+ppo 25638
+cra 25625
+mun 25557
+gst 25468
+ple 25466
+tur 25446
+kte 25438
+af_ 25092
+nve 25045
+sle 25037
+_im 24974
+ële 24955
+vei 24916
+tli 24913
+dur 24889
+wes 24877
+sme 24820
+olu 24777
+hil 24761
+ora 24756
+ces 24702
+htl 24542
+ekt 24534
+nod 24494
+har 24386
+sbe 24241
+ezo 24111
+eks 24100
+ole 24061
+zek 23930
+cho 23905
+bar 23860
+los 23788
+moc 23784
+ocr 23779
+ol_ 23737
+cië 23732
+iël 23623
+lf_ 23543
+oof 23467
+sis 23450
+bui 23434
+cto 23420
+ruk 23296
+ruc 23218
+wez 23207
+_cr 23191
+rea 23183
+nsp 23162
+_ru 23146
+_de_ 2115660
+_van 1102417
+van_ 1092345
+_het 917169
+het_ 906374
+_en_ 682815
+voor 649813
+een_ 645130
+_voo 600400
+ing_ 593013
+ten_ 591251
+dat_ 583365
+den_ 557773
+_een 557473
+_ver 546976
+_dat 538199
+_in_ 527999
+gen_ 502609
+oor_ 415388
+lijk 393435
+_te_ 363559
+_is_ 360439
+_aan 348686
+aar_ 333901
+ijn_ 308831
+_die 301134
+nder 300425
+_op_ 292508
+elij 289551
+aan_ 280878
+_zij 280005
+_ik_ 279904
+len_ 272676
+_nie 267155
+die_ 260772
+word 255721
+over 252850
+_wor 251546
+orde 250641
+ngen 248205
+eer_ 242363
+ken_ 240725
+ijk_ 240154
+_met 237354
+zijn 234052
+met_ 230862
+_wij 229136
+niet 228671
+ren_ 228478
+men_ 224983
+nen_ 224663
+iet_ 222133
+_ove 221183
+emen 221095
+ande 220103
+inge 219534
+rden 216721
+tie_ 214027
+euro 208511
+ment 208487
+_eur 208292
+_moe 207848
+_com 206633
+ter_ 203396
+eren 203339
+onde 200763
+eid_ 195748
+wij_ 193810
+_hee 193698
+_uit 193581
+urop 193154
+comm 191949
+moet 191521
+stel 185609
+_om_ 184037
+miss 181855
+als_ 180306
+ent_ 180011
+llen 178178
+ommi 176491
+ende 170755
+mmis 168185
+heid 164966
+ook_ 164581
+dit_ 164173
+_dit 164073
+waar 163292
+_ook 162603
+ver_ 160536
+ling 160480
+eft_ 158029
+_maa 157935
+echt 156887
+atie 156819
+ssie 155732
+lang 155463
+sie_ 153966
+chte 153645
+_heb 153211
+issi 152658
+_lan 152286
+ijke 152208
+rope 149873
+ring 149832
+_mij 146736
+deze 146053
+_dez 145808
+nde_ 145692
+ben_ 145283
+_er_ 144563
+eten 142957
+name 142765
+vers 142144
+_bes 141331
+sche 140427
+cht_ 139157
+eze_ 138188
+land 137586
+_nam 136976
+nnen 136059
+_als 134723
+_ond 133741
+eeft 133369
+_waa 133270
+even 132924
+oorz 132771
+der_ 131639
+ens_ 131493
+_bij 130085
+erin 128247
+eden 128125
+alle 127199
+_bel 127168
+_ste 126969
+werk 125840
+_pro 125675
+isch 125674
+mijn 125307
+orzi 125093
+heef 124339
+ven_ 122729
+eel_ 121923
+heer 121777
+jke_ 121685
+_par 121621
+zitt 120794
+ame_ 120757
+leme 120735
+itte 119909
+tter 119666
+_daa 119649
+_toe 119296
+_wer 118870
+ebbe 117850
+icht 117756
+hebb 117590
+bben 117323
+daar 116512
+ker_ 115297
+rzit 114751
+acht 114565
+deli 114190
+egen 114076
+_bet 113743
+_spe 113567
+ese_ 113174
+_all 112718
+ers_ 112425
+maar 112326
+nden 111898
+omen 111073
+sen_ 110703
+_sta 109862
+_tot 109393
+_wil 109220
+pese 108676
+door 108657
+oete 108648
+opes 108629
+_con 106904
+amen 106873
+oord 106596
+eld_ 105747
+_we_ 105582
+aat_ 105344
+rste 104725
+scha 103268
+_doo 102265
+tot_ 101664
+_geb 100206
+eken 98589
+_dan 98565
+dere 98313
+aten 97254
+tell 97042
+elin 96930
+erd_ 95922
+elen 95686
+king 95319
+bij_ 95245
+ige_ 94395
+_id_ 94237
+erde 94234
+ste_ 94130
+aard 93977
+oet_ 93201
+ale_ 92091
+che_ 92090
+_men 91999
+and_ 91741
+aker 91593
+rdt_ 90606
+_mee 90339
+parl 90262
+arle 90255
+spea 90156
+peak 90145
+eake 90117
+rlem 90051
+_kun 89782
+ordt 89780
+_gro 89472
+_gev 89394
+bela 89026
+rech 88693
+_kan 88303
+erst 88226
+geli 87201
+ente 85724
+ien_ 85669
+este 85306
+staa 85266
+unne 85231
+eerd 85164
+leid 85067
+slag 84858
+ere_ 84827
+keli 84746
+kunn 84292
+_vol 83959
+elan 83814
+ting 83781
+chap 82967
+gele 82623
+rege 80844
+ies_ 80707
+uit_ 80690
+_uni 80521
+_ont 79836
+ning 79435
+pen_ 79187
+ding 78141
+zich 77910
+ings 77811
+ange 77701
+_zou 77433
+dan_ 76972
+ele_ 76756
+_gel 76523
+nie_ 76487
+nten 76319
+inde 75389
+betr 75245
+eens 74596
+unie 74527
+ctie 74467
+itei 74011
+aad_ 73830
+lag_ 71936
+_ter 71909
+etre 71497
+ming 71393
+hand 71281
+_nog 71009
+ons_ 70989
+ersl 70794
+rsla 70746
+_wat 70725
+itie 70630
+ille 69924
+tege 69864
+raad 69698
+tion 69603
+stat 69502
+_reg 69370
+rsch 69236
+end_ 68925
+teit 68700
+ssen 68091
+_ons 68002
+aken 67790
+kan_ 67660
+_gee 67633
+_and 67572
+egel 67118
+verd 67052
+dien 66918
+nhee 66597
+ijnh 66520
+jnhe 66494
+tate 66300
+aats 66178
+igen 66114
+zien 66106
+ging 66070
+_zal 65889
+erke 65690
+_doe 65590
+ndel 65553
+zal_ 65511
+_of_ 65299
+nog_ 65223
+_raa 65137
+agen 65084
+oude 64994
+rde_ 64872
+rouw 64870
+wat_ 64869
+geen 64835
+aal_ 64756
+oors 64110
+_naa 63737
+meer 63545
+hten 63541
+_int 63004
+ier_ 62838
+houd 62799
+schi 62775
+rijk 62600
+vere 62517
+age_ 62297
+hier 62168
+naar 62094
+_hie 62039
+elle 61867
+stan 61843
+esch 61743
+wil_ 61701
+inte 61592
+tijd 61445
+aaro 61430
+goed 61349
+_wel 61289
+uite 60835
+ang_ 60471
+mens 60470
+best 60447
+elei 60057
+bele 59859
+ersc 59832
+laat 59637
+_zic 59455
+enin 59247
+zou_ 59230
+iten 59084
+ties 59084
+volg 58972
+_lid 58885
+woor 58729
+_onz 58665
+_beg 58651
+_gem 58495
+grot 58344
+kome 58310
+onze 58279
+voer 58136
+eit_ 58003
+_ges 57819
+sten 57717
+gest 57698
+_goe 57649
+raag 57575
+geme 57541
+wel_ 57455
+ich_ 57420
+nati 57292
+ntie 57085
+nter 57071
+rich 56877
+_sch 56734
+uden 56727
+nze_ 56474
+ster 56423
+moge 56376
+_ten 56267
+grij 55916
+hter 55900
+bied 55828
+dige 55793
+omst 55601
+geno 55561
+acti 55483
+_gaa 55150
+aag_ 54470
+orst 54351
+zond 54011
+_rec 53963
+ouw_ 53843
+_teg 53783
+elli 53713
+neme 53463
+_al_ 52958
+stem 52886
+zake 52782
+lle_ 52500
+kkel 52257
+tand 51686
+taat 51666
+geve 51659
+vrou 51623
+inst 51388
+_nu_ 51341
+iona 51293
+ontw 51221
+tere 50908
+zij_ 50724
+_gez 50717
+erki 50690
+_ins 50603
+_vra 50497
+zen_ 50494
+ieuw 50422
+_her 50272
+nieu 50267
+idst 50223
+rder 50089
+_str 50006
+oen_ 49893
+kken 49874
+ense 49733
+zelf 49732
+eers 49632
+_eer 49502
+enti 49350
+koms 49167
+gebr 48953
+nste 48893
+uage 48866
+_pla 48772
+angu 48756
+atio 48750
+ngua 48722
+guag 48698
+verb 48583
+_ech 48509
+gaan 48237
+geva 48217
+midd 48162
+_mog 48153
+enen 48094
+ngri 48068
+dsta 47989
+rati 47896
+_ben 47755
+ikke 47652
+ede_ 47619
+meen 47570
+dig_ 47563
+idde 47252
+drag 47203
+deel 47178
+nsch 47067
+lids 47052
+_kom 46611
+angr 46592
+llin 46199
+mend 46045
+dele 45810
+prob 45485
+punt 45440
+aang 45350
+emee 45174
+nsen 45131
+olge 45114
+will 44973
+vaar 44801
+ggen 44683
+verg 44562
+rkin 44460
+ensc 44454
+olle 44381
+besc 44362
+lgen 44260
+orge 44237
+ervo 44212
+ighe 43951
+_bev 43879
+gevo 43773
+_ame 43757
+ulle 43732
+hun_ 43655
+_hun 43588
+eree 43419
+econ 43289
+ijd_ 43278
+rage 43050
+_mil 43043
+veel 42950
+_zoa 42947
+zoal 42946
+tref 42941
+oals 42936
+ees_ 42916
+_zul 42801
+rede 42775
+ader 42607
+same 42598
+steu 42420
+ieve 42325
+_gew 42212
+teun 42132
+_beh 42086
+_zo_ 42073
+tiek 41992
+bete 41818
+eids 41767
+_wet 41760
+wikk 41602
+ropa 41600
+verw 41504
+tisc 41431
+_nat 41331
+unt_ 41327
+maat 41181
+_gen 41011
+doel 41009
+doen 40955
+wijz 40940
+opa_ 40878
+open 40784
+rdig 40778
+iede 40772
+onal 40748
+nale 40674
+eleg 40616
+ddel 40400
+leen 40367
+_sam 40269
+esti 40242
+ieke 40156
+vraa 40150
+hede 40109
+twee 40002
+_twe 39982
+egge 39947
+ntwi 39926
+rom_ 39719
+uitg 39688
+teld 39674
+ebie 39670
+plaa 39663
+reke 39657
+gebi 39638
+_dui 39483
+ogel 39418
+twik 39321
+poli 39299
+llee 39288
+verk 39253
+aire 39243
+onom 39124
+ders 39102
+taan 39094
+eder 39082
+vert 38950
+ire_ 38916
+jaar 38881
+_hoo 38863
+aand 38847
+robl 38763
+tel_ 38736
+happ 38640
+tuur 38589
+reen 38547
+zoek 38509
+trek 38492
+port 38451
+appe 38433
+besl 38340
+oble 38296
+stri 38273
+inne 38257
+arom 38253
+_ber 38244
+vorm 38239
+nomi 38178
+_bed 38105
+zull 38053
+rken 38032
+rond 38010
+opee 38003
+_fra 37983
+liti 37945
+blij 37898
+begr 37840
+erzo 37810
+_pol 37756
+usse 37737
+olit 37725
+evro 37706
+_hoe 37591
+_eco 37500
+pees 37499
+mevr 37483
+_mev 37472
+ijkh 37459
+jkhe 37458
+tair 37426
+_bep 37391
+cono 37314
+rote 37185
+aak_ 37106
+tern 37068
+arin 37036
+uide 36995
+chti 36971
+deme 36963
+esta 36932
+gend 36930
+ndem 36929
+erne 36791
+rlij 36569
+idel 36541
+verl 36517
+vind 36421
+_bli 36375
+eili 36326
+ord_ 36323
+tiev 36294
+tten 36271
+_tij 36258
+rmin 36201
+ghei 36145
+gens 36002
+hap_ 35952
+erge 35893
+_ged 35847
+anda 35829
+deri 35812
+_jaa 35776
+make 35687
+_vee 35644
+enst 35585
+sing 35401
+nome 35359
+duid 35268
+derd 35255
+rkt_ 35211
+_ind 35203
+enge 35195
+ijde 35113
+slui 35112
+nkel 35093
+est_ 35060
+_per 34946
+luit 34927
+proc 34762
+oort 34729
+oed_ 34698
+leve 34615
+erei 34608
+omis 34513
+_geh 34505
+rekk 34463
+eke_ 34453
+ermi 34396
+ffen 34390
+_res 34332
+arde 34327
+arti 34296
+_ric 34212
+stee 34203
+_ze_ 34176
+_bur 34124
+reid 34103
+burg 34072
+roce 33993
+nlij 33968
+euwe 33811
+rgen 33809
+uwe_ 33782
+aren 33774
+orte 33611
+iste 33572
+rach 33433
+ette 33316
+rzoe 33294
+egd_ 33274
+tuss 33270
+_han 33245
+eide 33224
+evol 33200
+lde_ 33148
+_zee 33091
+_haa 32928
+spec 32928
+temm 32791
+ogen 32787
+eter 32753
+derh 32646
+_afg 32632
+_der 32614
+sch_ 32608
+_min 32584
+enom 32507
+_mak 32446
+chts 32391
+peli 32312
+gaat 32253
+heb_ 32238
+lijn 32187
+tste 32049
+bere 32046
+soci 32032
+ssin 31999
+ntwo 31908
+bevo 31874
+stig 31835
+_vor 31820
+twoo 31780
+evoe 31743
+ving 31694
+_tus 31673
+lega 31666
+antw 31664
+geri 31541
+_mar 31489
+ocia 31465
+vera 31387
+ppel 31315
+aris 31285
+egin 31283
+misc 31236
+ardi 31192
+spro 31070
+_zeg 31055
+enig 31034
+ijze 30990
+enhe 30979
+_wee 30963
+ruik 30950
+effe 30926
+rvan 30902
+teri 30839
+erhe 30808
+kkin 30804
+brui 30780
+eem_ 30720
+conc 30679
+haar 30676
+afge 30667
+mij_ 30667
+ters 30623
+urge 30563
+dank 30538
+_soc 30516
+zorg 30440
+iden 30430
+rant 30414
+elde 30392
+mst_ 30391
+lich 30386
+gere 30366
+verz 30265
+rger 30256
+_eve 30244
+ogra 30228
+eeld 30219
+late 29955
+issa 29913
+_inz 29898
+_mid 29844
+umen 29844
+cont 29799
+_noo 29759
+kend 29711
+mati 29698
+verv 29687
+onge 29671
+_ing 29649
+bouw 29629
+edig 29622
+eker 29616
+mark 29603
+nkom 29535
+cons 29533
+ouwe 29515
+zeer 29513
+eeds 29479
+geze 29361
+erha 29298
+oorb 29279
+evin 29270
+rdel 29234
+opge 29207
+gewe 29203
+ekom 29200
+erwe 29169
+_zel 29164
+nhei 29155
+prod 29147
+_opg 29142
+_hel 29116
+mee_ 29106
+eval 29088
+spre 29080
+eran 29073
+_vri 28955
+vrij 28950
+enke 28933
+mili 28928
+ied_ 28892
+cent 28890
+_was 28807
+eige 28734
+heel 28723
+ijve 28634
+stra 28634
+isse 28603
+stre 28590
+_omd 28563
+mdat 28502
+omda 28502
+ebru 28492
+prog 28458
+_vin 28386
+_col 28363
+rogr 28293
+gers 28276
+emaa 28250
+eite 28249
+toe_ 28243
+part 28240
+was_ 28229
+ort_ 28200
+gram 28176
+enwe 28151
+baar 28139
+idin 28099
+ant_ 28085
+uwen 28059
+_wan 27996
+akt_ 27984
+aant 27942
+rodu 27869
+vast 27867
+cial 27837
+ramm 27807
+ever 27794
+oede 27752
+lleg 27711
+treg 27658
+eds_ 27642
+eidi 27638
+enko 27633
+reng 27630
+ris_ 27627
+aakt 27574
+igde 27513
+ief_ 27507
+igin 27493
+oek_ 27474
+teke 27406
+volk 27392
+atre 27356
+aatr 27342
+derz 27339
+eve_ 27316
+stru 27301
+jven 27279
+form 27227
+erk_ 27139
+_vas 27116
+anta 27098
+aarv 27067
+anci 27052
+dus_ 27037
+verh 27035
+_act 27034
+gde_ 27022
+rite 27019
+coll 27007
+arkt 27004
+krij 26973
+iale 26964
+sari 26955
+ntal 26935
+ssar 26923
+cten 26893
+tige 26891
+rent 26866
+eur_ 26802
+amma 26801
+uits 26798
+nanc 26760
+inan 26755
+mma_ 26749
+_dus 26732
+fina 26718
+khei 26660
+tal_ 26647
+_fin 26599
+jden 26580
+_hou 26577
+bepa 26549
+oren 26477
+iek_ 26388
+iens 26360
+zegg 26352
+orbe 26324
+roep 26321
+slot 26281
+ezen 26276
+lege 26258
+ote_ 26222
+erva 26205
+lede 26135
+oduc 26098
+hte_ 26052
+eind 26036
+erdr 26012
+ract 25899
+iter 25737
+schr 25714
+lite 25662
+_pri 25657
+tig_ 25585
+egro 25581
+anne 25558
+erle 25554
+gron 25460
+orme 25433
+bedr 25431
+rhei 25402
+rin_ 25361
+_kri 25351
+deba 25290
+ake_ 25263
+denk 25261
+ebat 25260
+cher 25249
+eenk 25156
+crat 25133
+uati 25058
+alis 25048
+tief 25031
+gang 24989
+ilig 24983
+_med 24966
+_dee 24950
+rapp 24937
+odig 24911
+_ger 24889
+_hij 24886
+veil 24850
+west 24835
+ële_ 24816
+hij_ 24802
+_den 24751
+stie 24741
+ond_ 24738
+uur_ 24691
+ontr 24654
+ast_ 24627
+bren 24567
+maak 24563
+chtl 24542
+tlij 24521
+aans 24518
+ekki 24486
+aald 24427
+rijd 24399
+htli 24397
+ger_ 24355
+enli 24352
+_man 24330
+_eig 24313
+rend 24282
+erna 24257
+ega_ 24247
+anke 24241
+_deb 24229
+regi 24219
+teur 24198
+_bre 24133
+ist_ 24126
+ppor 24112
+nodi 24048
+geld 24034
+gezi 23995
+chil 23974
+_voe 23958
+zeke 23928
+groe 23885
+nwer 23833
+nse_ 23801
+seri 23798
+igd_ 23741
+_bin 23723
+_dem 23723
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/pl.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/pl.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/pl.ngp (working copy)
@@ -1,6 +1,4 @@
# NgramProfile generated at Sat Sep 25 17:22:22 EEST 2004 for Nutch Language Identification
-ngram_count 3110669
-_ 167552
a 102725
e 88777
i 88728
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/it.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/it.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/it.ngp (working copy)
@@ -1,1002 +1,3059 @@
-# NgramProfile generated at Sat Sep 25 16:06:09 EEST 2004 for Nutch Language Identification
-ngram_count 21384310
-_ 1202008
-e 857254
-i 821810
-a 686764
-o 672152
-n 526991
-r 477836
-t 476266
-l 430660
-s 360907
-e_ 301519
-c 288167
-d 260793
-i_ 235733
-o_ 233762
-p 220701
-u 213897
-a_ 209582
-m 201333
-on 151084
-re 127701
-g 108385
-er 108089
-v 102137
-en 101045
-co 98551
-io 95527
-nt 94837
-di 93353
-de 93017
-la 89951
-to 89209
-ne 87444
-ri 86289
-ti 86001
-z 82865
-in 82670
-ta 82207
-te 82041
-si 78239
-al 76812
-el 75793
-to_ 75533
-no 73867
-es 72847
-ar 72354
-l_ 72327
-at 72242
-ll 69520
-st 68342
-h 67767
-or 67575
-ra 67485
-le 67213
-b 66252
-f 66136
-li 66018
-ion 65997
-n_ 65602
-an 65330
-re_ 61189
-ro 60925
-ne_ 59047
-me 58514
-ent 56018
-tt 55445
-ch 55079
-zi 53781
-pe 52910
-ia 52222
-pr 51901
-one 50722
-one_ 49639
-it 49540
-un 49456
-ione 48192
-is 47088
-ic 46241
-ni 45998
-ol 45056
-ss 45041
-del 44222
-po 43611
-he 42782
-zio 42592
-se 42351
-am 42194
-che 41776
-il 41481
-ell 41403
-tr 41066
-he_ 41009
-zion 40701
-ti_ 40156
-te_ 39045
-so 38578
-le_ 38518
-con 38401
-na 37416
-ci 35637
-men 35513
-nte 35360
-no_ 34364
-ca 34117
-mi 33966
-om 33791
-os 33689
-q 32863
-qu 32752
-la_ 32264
-per 32168
-ment 31994
-mo 30645
-ma 30564
-dell 29803
-az 29743
-da 29375
-azi 29233
-pa 29184
-nd 29048
-lla 28804
-ve 28326
-et 27707
-azio 27562
-lla_ 27323
-r_ 26931
-are 26844
-do 26763
-ta_ 26400
-ur 26369
-li_ 25958
-im 24828
-com 24561
-vo 24540
-op 24175
-nte_ 23909
-lo 23726
-are_ 23606
-ut 23519
-ce 23477
-nto 23173
-vi 23118
-nto_ 22836
-em 22689
-eg 22452
-tu 22306
-pro 22263
-sa 22173
-ni_ 22123
-ue 21984
-bi 21850
-gi 21769
-on_ 21487
-sta 21407
-est 21270
-er_ 21129
-iv 21012
-ua 20694
-ere 20690
-ame 20648
-ente 20620
-io_ 20516
-ie 20463
-rt 20343
-su 20324
-pre 20275
-ato 20139
-ec 20136
-ssi 20073
-Ã 19946
-Ã _ 19931
-nc 19930
-amen 19701
-el_ 19167
-ono 19136
-as 19091
-nz 19036
-ei 18787
-ess 18759
-all 18645
-lt 18448
-ett 18428
-va 18379
-ia_ 18278
-ed 18151
-ati 18140
-gl 17982
-que 17941
-ro_ 17878
-ll_ 17740
-ter 17687
-mp 17514
-gli 17425
-res 17381
-ella 17362
-ir 17164
-pi 16799
-fi 16703
-ato_ 16682
-rop 16632
-id 16350
-tat 16350
-za 16339
-ra_ 16189
-mo_ 16135
-tti 16134
-sp 16080
-nti 16049
-ale 16041
-tra 15995
-ri_ 15862
-att 15813
-ica 15777
-ali 15764
-sc 15762
-ere_ 15696
-ost 15632
-tto 15623
-lle 15578
-ev 15521
-ale_ 15488
-na_ 15452
-par 15395
-ig 15354
-ns 15048
-ei_ 14940
-non 14824
-sio 14621
-sion 14591
-ento 14587
-oc 14585
-do_ 14349
-mm 14279
-ot 14248
-cu 14190
-ov 14169
-è 14152
-ant 14130
-oni 14051
-ari 14035
-cc 14022
-tà 13645
-tà _ 13644
-av 13536
-pp 13406
-ad 13398
-ues 13356
-ques 13344
-uest 13275
-ac 13138
-og 12993
-pos 12935
-ea 12779
-str 12738
-esi 12582
-iam 12421
-iz 12334
-sti 12321
-so_ 12285
-ioni 12254
-oni_ 12198
-pres 12197
-tiv 12178
-lu 12120
-lle_ 12093
-ap 11970
-bb 11823
-ico 11794
-ont 11693
-gr 11687
-ag 11642
-uro 11613
-ui 11603
-si_ 11583
-eri 11560
-ul 11538
-tta 11450
-tto_ 11392
-una 11383
-enz 11379
-nel 11368
-tic 11356
-eu 11334
-ono_ 11328
-fo 11314
-ell_ 11271
-za_ 11255
-nta 11194
-fa 11132
-rat 11122
-uni 11097
-ati_ 10916
-rm 10913
-qua 10852
-ist 10845
-nti_ 10832
-mis 10811
-ten 10727
-nn 10715
-nor 10687
-ca_ 10641
-lo_ 10583
-eur 10565
-gn 10549
-iss 10490
-euro 10488
-ore 10471
-col 10446
-mmi 10402
-ver 10359
-hi 10350
-rr 10349
-go 10329
-ità 10328
-ità _ 10327
-ste 10250
-amo 10220
-int 10197
-sto 10068
-omm 10058
-che_ 10055
-rit 10043
-amo_ 9959
-ide 9897
-comm 9893
-ssio 9881
-iamo 9837
-anc 9652
-ope 9635
-urop 9632
-if 9600
-lit 9594
-vol 9532
-rc 9513
-tan 9493
-utt 9489
-era 9480
-bil 9458
-miss 9446
-rs 9431
-tar 9412
-tro 9387
-us 9363
-ge 9327
-ire 9296
-ab 9274
-ali_ 9271
-nza 9246
-sto_ 9199
-enti 9162
-ori 9113
-ese 9088
-cor 9036
-mmis 9031
-olt 9023
-ib 9014
-nza_ 8955
-se_ 8950
-dei 8945
-od 8924
-ommi 8919
-ons 8906
-ris 8902
-uo 8890
-sen 8831
-oli 8816
-ran 8748
-chi 8704
-mb 8693
-tor 8691
-end 8651
-inte 8643
-be 8630
-ric 8605
-ff 8528
-ga 8513
-elle 8492
-ano 8481
-cont 8418
-ela 8415
-enta 8413
-sse 8407
-iti 8402
-me_ 8389
-ndo 8368
-tti_ 8310
-tut 8301
-den 8293
-ora 8290
-ng 8276
-ser 8244
-gg 8243
-ito 8199
-rd 8190
-ili 8188
-ata 8180
-son 8175
-stat 8171
-sig 8170
-ica_ 8167
-ond 8127
-der 8101
-du 8101
-alla 8065
-rio 8046
-issi 8043
-ann 7982
-ssa 7934
-zz 7926
-ort 7920
-rn 7917
-iu 7884
-ina 7878
-sta_ 7855
-ita 7854
-ha 7847
-por 7846
-gra 7838
-ntr 7822
-cons 7807
-ip 7789
-pri 7762
-fe 7719
-izi 7696
-sid 7674
-and 7657
-tal 7657
-rope 7643
-nu 7604
-pu 7597
-nzi 7541
-ome 7505
-ano_ 7420
-art 7418
-ndi 7336
-tutt 7256
-side 7254
-sso 7247
-cr 7205
-ndo_ 7200
-ma_ 7181
-ba 7170
-sul 7163
-rl 7154
-zia 7136
-gio 7125
-ini 7123
-dal 7093
-fic 7087
-spe 7067
-erc 7060
-ene 7056
-oss 7023
-dir 7004
-esto 7003
-rev 6990
-for 6966
-evo 6907
-ito_ 6900
-ual 6852
-co_ 6837
-app 6828
-nter 6824
-sono 6819
-enza 6772
-ob 6768
-gu 6737
-ura 6729
-dis 6724
-ona 6702
-anz 6668
-ass 6642
-up 6632
-ggi 6630
-imp 6597
-ata_ 6579
-po_ 6579
-sar 6565
-nch 6557
-ai 6553
-nsi 6540
-gno 6498
-ede 6481
-tri 6480
-ru 6476
-port 6475
-ate 6467
-iva 6463
-sia 6448
-af 6443
-nal 6435
-ire_ 6429
-ici 6421
-nell 6370
-ria 6323
-va_ 6314
-opo 6307
-iar 6299
-fin 6284
-rta 6282
-gli_ 6277
-nda 6271
-sa_ 6264
-di_ 6261
-cia 6253
-tre 6242
-rre 6209
-lam 6208
-acc 6203
-itt 6191
-ola 6190
-ien 6172
-rio_ 6158
-fr 6141
-nno 6137
-dent 6136
-tato 6125
-d_ 6124
-olo 6111
-iden 6110
-tte 6106
-etti 6095
-arl 6081
-zza 6078
-sol 6039
-au 6022
-esid 6019
-tati 6012
-etto 5955
-ich 5951
-isc 5946
-prop 5942
-eb 5940
-ppo 5876
-br 5869
-ive 5857
-ven 5844
-ime 5843
-ole 5774
-ore_ 5770
-part 5754
-esse 5723
-ltr 5723
-pol 5719
-tur 5705
-vor 5701
-anto 5694
-mpo 5692
-ine 5672
-eco 5666
-raz 5652
-llo 5636
-man 5626
-tare 5598
-alt 5590
-ero 5580
-sso_ 5571
-lame 5565
-min 5546
-rla 5544
-anno 5542
-nde 5517
-ott 5517
-evol 5513
-nno_ 5501
-orm 5499
-ve_ 5471
-ea_ 5467
-lio 5443
-tant 5440
-mer 5437
-esti 5425
-rel 5415
-ostr 5403
-cos 5401
-mu 5380
-ep 5368
-nf 5367
-rti 5355
-razi 5308
-nos 5292
-rim 5292
-ign 5279
-post 5258
-ani 5254
-ren 5234
-arla 5210
-rela 5193
-orr 5190
-anch 5187
-tori 5185
-resi 5179
-ome_ 5165
-parl 5150
-tit 5148
-ior 5147
-ial 5144
-um 5117
-rma 5111
-nio 5110
-ci_ 5097
-ers 5083
-sent 5075
-ole_ 5069
-ile 5066
-isp 5066
-llo_ 5058
-edi 5050
-ebb 5047
-lat 5037
-ern 5032
-laz 5026
-ori_ 5020
-ù 5020
-ù_ 5020
-lazi 5017
-sign 5015
-cco 5000
-nche 4958
-tro_ 4957
-ttiv 4943
-iona 4942
-bia 4922
-omp 4891
-iù 4881
-iù_ 4881
-uz 4881
-eci 4880
-izio 4877
-più 4873
-uzi 4858
-uzio 4854
-spo 4851
-nion 4850
-vo_ 4848
-inc 4842
-ces 4826
-bili 4813
-esta 4796
-comp 4793
-ui_ 4785
-ò 4779
-ara 4776
-pet 4776
-ò_ 4769
-ico_ 4727
-sser 4722
-egl 4721
-ivi 4720
-glio 4717
-cat 4716
-egli 4709
-eme 4706
-tiva 4696
-uto 4690
-qual 4686
-rese 4684
-occ 4682
-é 4682
-poli 4675
-tem 4669
-ce_ 4663
-ove 4657
-ero_ 4650
-nit 4643
-mi_ 4617
-orre 4617
-trat 4611
-poss 4608
-ativ 4601
-igno 4589
-é_ 4579
-izz 4572
-gnor 4566
-ez 4559
-bl 4556
-itic 4547
-fer 4544
-cess 4539
-ert 4539
-revo 4518
-ontr 4510
-ae 4509
-ret 4505
-ull 4489
-onc 4483
-ile_ 4480
-ifi 4475
-uan 4468
-unio 4467
-come 4465
-bbi 4464
-rà 4463
-abi 4456
-rà _ 4453
-reg 4451
-essi 4429
-pl 4424
-oro 4418
-esso 4392
-oll 4383
-mat 4382
-icol 4371
-ario 4369
-car 4368
-tica 4367
-ind 4351
-orev 4350
-nci 4343
-olit 4343
-econ 4337
-ria_ 4333
-ttu 4328
-liti 4322
-ral 4317
-omu 4312
-ratt 4310
-igl 4304
-quan 4303
-itu 4296
-ner 4296
-stra 4292
-igli 4287
-rlam 4282
-bbe 4279
-leg 4279
-ece 4276
-ebbe 4271
-avo 4260
-agg 4256
-emp 4243
-onal 4243
-ef 4226
-rte 4226
-lor 4212
-ie_ 4209
-ord 4208
-iva_ 4195
-altr 4171
-giu 4158
-sull 4151
-rg 4150
-abil 4144
-sit 4138
-lità 4114
-onsi 4114
-bbia 4102
-eo 4095
-reb 4093
-cen 4086
-imen 4080
-ropo 4077
-egi 4076
-lar 4073
-nore 4073
-oro_ 4073
-emb 4067
-ima 4067
-rebb 4063
-osi 4057
-de_ 4049
-aggi 4046
-onor 4034
-izza 4028
-or_ 4024
-mun 4020
-esen 4008
-pea 4005
-iat 4001
-vole 4000
-ibi 3998
-opea 3997
-olo_ 3995
-nat 3991
-pea_ 3985
-nost 3982
-rv 3981
-dall 3979
-ino 3979
-orta 3978
-omun 3966
-comu 3965
-ante 3955
-avor 3954
-ific 3947
-iri 3944
-oi 3930
-lin 3928
-osta 3920
-conc 3919
-da_ 3886
-upp 3876
-rie 3875
-ivo 3863
-amb 3862
-iso 3856
-cit 3852
-ibil 3848
-anti 3827
-rico 3826
-tale 3820
-dic 3805
-rog 3804
-erm 3803
-tua 3795
-nv 3792
-rar 3792
-cono 3774
-alle 3772
-hé 3769
-ché 3767
-hé_ 3767
-mod 3766
-ché_ 3765
-ari_ 3762
-odo 3761
-deg 3757
-ens 3745
-imi 3733
-mbi 3732
-lta 3698
-al_ 3697
-form 3692
-lic 3688
-ambi 3687
-erv 3682
-aff 3678
-eve 3658
-ate_ 3655
-nco 3647
-tico 3644
-aes 3630
-sem 3625
-rov 3624
-ian 3621
-cre 3618
-dere 3618
-fica 3616
-cer 3607
-atti 3602
-ritt 3600
-ossi 3599
-sere 3594
-sis 3591
-biam 3583
-ssar 3582
-mbr 3579
-esi_ 3577
-eno 3570
-arti 3554
-essa 3553
-qui 3543
-sist 3540
-embr 3509
-lio_ 3506
-ema 3504
-ppo_ 3503
-go_ 3493
-pae 3493
-paes 3493
-anzi 3487
-emen 3481
-ando 3473
-rtan 3467
-gen 3464
-sv 3462
-iste 3457
-nor_ 3449
-tes 3449
-ue_ 3446
-cond 3445
-ult 3443
-pon 3433
-ntro 3424
-rin 3421
-opos 3407
-tere 3407
-esp 3405
-tura 3397
-dire 3394
-tam 3393
-ite 3385
-nzia 3384
-vi_ 3384
-ello 3380
-hia 3375
-pett 3369
-spet 3368
-err 3365
-etta 3364
-orma 3361
-omi 3360
-imo 3356
-chia 3355
-ele 3352
-lc 3347
-ener 3345
-sari 3338
-diri 3335
-ine_ 3331
-ram 3329
-ora_ 3325
-irit 3324
-din 3323
-dam 3316
-fat 3313
-isi 3305
-alc 3302
-iet 3302
-uant 3301
-impo 3299
-tta_ 3297
-ste_ 3290
-elaz 3280
-nom 3280
-rso 3275
-ffi 3255
-mpor 3254
-via 3254
-uto_ 3249
-ura_ 3248
-gua 3241
-fatt 3239
-be_ 3237
-tre_ 3235
-utto 3233
-ivo_ 3230
-ator 3225
-rsi 3221
-uti 3218
-fon 3212
-ure 3208
-ppr 3205
-iche 3202
-ilit 3195
-ici_ 3188
-dov 3182
-oci 3178
-cui 3165
-nan 3152
-soc 3130
-ende 3129
-uta 3126
-lem 3116
-rif 3116
-mol 3115
-dame 3114
-appr 3113
-ient 3113
-nzio 3106
-bile 3099
-bbe_ 3098
-rea 3096
-atto 3089
-ard 3088
-enzi 3087
-mpi 3086
-ova 3086
-seg 3085
-adi 3076
-inf 3072
-opr 3072
-unit 3071
-vr 3070
-pen 3064
-pot 3062
-atta 3061
-des 3061
-abb 3055
-tame 3053
-posi 3025
-vis 3024
-degl 3019
-ron 3012
-uppo 2998
-bu 2976
-ggio 2975
-lm 2975
-indi 2974
-roc 2961
-perc 2959
-sti_ 2955
-teri 2954
-vv 2948
-sco 2944
-dev 2940
-prim 2939
-cio 2937
-uar 2937
-arte 2935
-naz 2935
-nazi 2935
-tim 2935
-t_ 2930
-fond 2923
-risp 2923
-ese_ 2915
-ice 2915
-molt 2914
-rem 2911
+# NgramProfile generated at Tue May 31 02:19:19 CEST 2005 for Nutch Language Identification
+e 17517090
+i 16228898
+a 13947715
+o 13373289
+n 10665868
+r 9608599
+t 9462870
+l 8667625
+s 7437877
+c 5737693
+d 5295320
+p 4796286
+u 4348217
+m 4113921
+g 2290504
+v 2013310
+z 1642201
+h 1372569
+b 1320506
+f 1294369
+q 648639
+à387216
+è 297595
+k 144452
+é 124524
+ò 97853
+ù 97251
+ì 40709
+y 31069
+x 28338
+w 22300
+j 22267
+ö 6386
+á 2917
+à2576
+ê 2227
+ü 1996
+ä 1944
+ó 1855
+º 1040
+æ 692
+ç 644
+ô 546
+ú 423
+î 418
+ñ 361
+û 325
+â 254
+ã 248
+ß 239
+ø 231
+ï 132
+Ã¥ 115
+ë 50
+ª 21
+õ 4
+ý 4
+ð 2
+e_ 6838234
+i_ 4767842
+o_ 4670087
+a_ 4524044
+_d 3364536
+on 3023351
+_p 2759826
+_c 2719366
+re 2550143
+_s 2358087
+_a 2314398
+er 2211163
+_i 2009740
+en 2005959
+co 1959627
+io 1896226
+nt 1879777
+de 1878157
+di 1800059
+to 1781070
+la 1773028
+l_ 1762124
+ne 1744898
+ti 1682746
+ri 1666136
+te 1659072
+ta 1626247
+in 1594130
+si 1594112
+_l 1593595
+_e 1544476
+es 1476318
+al 1464856
+no 1453339
+el 1435448
+ar 1412473
+at 1402741
+st 1372549
+ll 1371353
+or 1355386
+an 1345335
+ra 1344486
+n_ 1343476
+le 1304576
+me 1260236
+li 1235143
+ro 1215871
+pe 1141897
+ch 1096324
+_n 1086043
+tt 1072285
+pr 1060255
+zi 1058328
+ia 1022237
+un 986233
+_r 971602
+it 958507
+ni 917234
+_m 915561
+is 914537
+ss 901263
+am 896240
+ol 888296
+ic 880508
+po 866422
+se 853020
+he 848097
+il 830587
+na 827553
+tr 809994
+_u 805316
+so 774832
+ci 690964
+_t 673691
+ca 671702
+mi 671341
+os 669531
+om 664250
+r_ 651727
+qu 644675
+ma 614283
+mo 610435
+pa 598121
+az 590605
+nd 581050
+_q 570166
+_f 566717
+da 555028
+ve 551441
+et 538517
+ur 535786
+do 533294
+_o 530810
+vo 494228
+_v 487301
+op 482497
+im 481247
+ce 469585
+_g 464632
+ut 463373
+ue 452752
+vi 449703
+tu 444255
+sa 442621
+em 441590
+ua 440511
+gi 431406
+lo 423805
+id 421091
+eg 419748
+su 418780
+bi 414103
+rt 412020
+sp 408328
+ie 407926
+nc 397820
+iv 397286
+à_ 387095
+lt 370608
+gl 369535
+nz 368836
+va 359654
+mp 355742
+as 354707
+fi 325804
+pi 325453
+za 324818
+ec 324631
+ns 323181
+ig 316486
+ir 315537
+sc 312437
+ev 297625
+ei 294754
+è_ 292361
+ot 288430
+ag 287567
+ea 287257
+_è 284017
+mm 281481
+cc 279194
+cu 277240
+oc 276553
+d_ 270822
+ov 269529
+av 268694
+p_ 267075
+pp 266395
+tà258974
+ed 253805
+_b 251168
+og 246974
+ad 246698
+ul 243263
+ge 242232
+iz 234126
+ac 231252
+bb 231029
+gr 230868
+ui 230669
+fa 227732
+eu 221677
+rm 220947
+ng 220689
+nn 218630
+gn 214883
+fo 214401
+ap 211805
+hi 201997
+lu 200666
+go 200219
+rr 197824
+us 197188
+_h 197128
+rs 188871
+gu 186120
+rc 185364
+ga 177065
+ab 175548
+ib 173128
+if 171703
+be 171328
+rd 169635
+ha 169618
+gg 168662
+ff 167965
+mb 167144
+du 166002
+od 163389
+uo 163129
+zz 156148
+iu 153477
+cr 152852
+pu 150712
+rn 150419
+nu 149325
+rl 147670
+fe 146119
+ba 140231
+ob 130716
+ai 129662
+ru 129107
+up 127689
+br 120757
+fr 116289
+s_ 115299
+au 110850
+mu 108738
+eb 105937
+nf 105192
+ip 103884
+uz 101414
+um 100648
+ez 99636
+bl 98547
+ò_ 97552
+ù_ 97241
+ke 96572
+ak 95988
+é_ 94759
+iù 94298
+pl 92959
+af 91734
+rg 89175
+rà87882
+ae 84978
+t_ 82730
+oi 79559
+eo 75955
+hé 74761
+rv 73967
+ef 73414
+nv 71367
+sv 66603
+u_ 62448
+bu 62313
+lc 61947
+vr 61001
+lm 59428
+vv 59024
+ep 56029
+fu 55485
+cl 54178
+bo 53849
+ze 51517
+ub 50370
+ud 48518
+rz 47509
+uc 45645
+of 45614
+gh 42894
+sf 41879
+iò 41031
+ì_ 40557
+ho 38387
+c_ 37735
+ug 36366
+dr 36208
+sì 35841
+zo 35738
+sm 35566
+lg 31982
+dd 31788
+uò 31046
+nq 30974
+ià30079
+oo 28978
+fl 28665
+vu 26642
+m_ 25854
+oz 25361
+ou 25117
+rò 23454
+sl 22969
+ee 22691
+g_ 19838
+_k 19165
+eq 18530
+x_ 18098
+uf 17631
+cn 16403
+rb 16192
+ls 16071
+lv 16013
+oe 15090
+y_ 13820
+h_ 13637
+né 12683
+k_ 12084
+_z 12067
+_j 12052
+_x 11898
+cq 11250
+rp 11183
+z_ 11176
+_w 11132
+sb 11049
+bc 10992
+th 9840
+ld 9711
+v_ 9093
+nl 8791
+ts 8728
+pt 8641
+ki 8469
+ko 8459
+b_ 8351
+ka 8345
+lp 7728
+rf 7718
+ck 7671
+ex 6546
+ré 6447
+ux 6011
+sh 5883
+mc 5839
+wa 5778
+ps 5730
+tn 5622
+je 5477
+ms 5470
+iq 5425
+f_ 5422
+_à5385
+té 5374
+hu 5315
+oè 5142
+ii 4978
+_é 4869
+sr 4808
+ct 4800
+ey 4753
+xe 4573
+és 4374
+aa 4366
+oa 4354
+sé 4201
+dé 4156
+tl 4047
+hr 3956
+ao 3922
+dì 3914
+lb 3769
+ah 3761
+ij 3744
+ay 3713
+ja 3692
+jo 3687
+hl 3663
+ér 3655
+wi 3588
+we 3580
+ée 3558
+ik 3517
+nk 3473
+ow 3436
+dt 3180
+aq 3151
+q_ 2975
+oh 2938
+rk 2831
+ét 2793
+yo 2786
+là2772
+ju 2771
+ye 2721
+gm 2698
+sk 2682
+sn 2675
+wo 2659
+éc 2649
+uv 2623
+hn 2595
+pé 2584
+sq 2578
+lz 2573
+cp 2513
+lf 2471
+hè 2409
+ph 2384
+ek 2367
+ly 2365
+hm 2352
+ht 2266
+_y 2250
+ry 2200
+tù 2179
+ky 2160
+mé 2142
+ok 2141
+tz 2096
+ys 2071
+èr 2010
+w_ 2000
+oy 1977
+lé 1965
+pm 1957
+ew 1952
+ds 1935
+lq 1930
+fg 1902
+ég 1901
+tm 1885
+yn 1878
+eh 1820
+by 1796
+iè 1786
+rh 1776
+bs 1775
+nh 1768
+j_ 1761
+sg 1730
+ya 1727
+rö 1583
+dà1567
+él 1555
+oq 1549
+én 1547
+ft 1542
+xi 1494
+yr 1484
+ál 1480
+êt 1413
+yl 1389
+oj 1362
+ty 1352
+év 1343
+ón 1330
+lk 1314
+zu 1311
+dg 1301
+kl 1291
+rè 1275
+ès 1266
+ör 1244
+sd 1236
+kr 1220
+éd 1192
+nb 1180
+cs 1177
+ln 1167
+xt 1129
+ró 1118
+ix 1111
+ox 1109
+hy 1108
+my 1096
+sw 1091
+án 1088
+ös 1087
+kh 1086
+cm 1076
+ÃÂn 1065
+sy 1049
+pz 1046
+º_ 1035
+ks 1028
+ép 1020
+pò 1019
+ws 1010
+öm 1005
+än 986
+ém 980
+zá 968
+rq 941
+dy 927
+vé 898
+_º 894
+ié 893
+jö 890
+ny 886
+bö 865
+tc 861
+wu 856
+èm 851
+lè 847
+rü 838
+xa 836
+_ê 832
+aj 829
+uy 809
+xx 803
+db 801
+gö 783
+ÃÂa 759
+yt 758
+aw 749
+jk 742
+ué 740
+js 734
+üb 732
+ml 729
+bj 721
+ku 719
+sj 718
+qv 716
+wh 716
+gt 714
+lh 713
+dm 711
+rà704
+nr 703
+cy 692
+uh 688
+uj 688
+bw 684
+dz 680
+öt 676
+fé 670
+gé 659
+tw 656
+éf 653
+jt 650
+pc 645
+êm 636
+gd 634
+ji 634
+bé 628
+lì 626
+éa 618
+yi 611
+uq 610
+nm 598
+wy 598
+cé 593
+tà572
+mê 567
+fs 562
+zq 557
+xp 547
+dn 543
+wl 535
+uk 534
+_á 533
+dh 510
+py 509
+ej 499
+km 498
+pä 492
+öd 488
+cà485
+èg 477
+dq 476
+mn 470
+pn 469
+üh 454
+hö 450
+ön 446
+éb 438
+bh 429
+ná 428
+éq 428
+wm 426
+vc 425
+fm 423
+kn 423
+iw 420
+vs 420
+nè 419
+æk 419
+bæ 418
+nw 414
+ih 397
+sá 393
+éo 386
+hw 385
+mü 382
+ül 381
+kk 376
+jn 368
+éj 368
+hä 364
+pv 361
+dü 359
+zn 352
+ax 349
+df 344
+dw 343
+dà343
+ça 340
+xc 335
+dl 334
+nj 334
+bd 328
+kj 328
+bn 326
+ym 325
+uw 324
+rê 322
+sö 322
+öl 314
+gy 313
+iö 307
+ó_ 303
+yb 301
+ún 297
+aî 296
+tè 296
+jà295
+tê 293
+ÃÂ_ 291
+rô 290
+kt 287
+cú 286
+uu 284
+är 284
+ôl 284
+kx 282
+bk 280
+sò 280
+dö 279
+tb 277
+fä 271
+dc 267
+má 266
+dj 259
+mf 257
+mè 257
+où 257
+hd 256
+öh 255
+tò 253
+òl 253
+aç 252
+rw 252
+äm 250
+ão 246
+só 245
+cò 242
+kä 241
+fè 238
+ög 232
+sà227
+ær 225
+ÃÂe 224
+lö 223
+bù 221
+jæ 221
+lä 221
+yu 218
+mt 217
+ço 217
+pk 216
+gs 215
+öw 215
+öö 215
+zh 208
+zb 207
+ît 206
+cd 204
+tf 204
+cf 199
+np 198
+ût 198
+ør 190
+añ 186
+dk 186
+mh 185
+pö 184
+zf 184
+cè 183
+oû 181
+mr 179
+dè 174
+sè 174
+zs 174
+ün 174
+mg 173
+fy 170
+fn 169
+rù 168
+ôt 168
+yp 165
+qa 164
+hh 163
+ß_ 163
+bt 161
+kv 161
+èt 161
+wn 160
+tv 158
+zl 158
+gü 157
+yk 157
+wt 154
+rç 153
+pè 147
+jø 146
+ló 146
+xv 146
+ño 146
+aß 144
+yh 144
+éu 142
+gb 140
+nç 137
+gp 136
+fc 135
+hj 134
+kf 134
+yd 133
+óp 133
+nº 132
+âc 128
+á_ 124
+hk 123
+ñe 123
+dò 121
+èd 121
+vl 120
+tx 119
+_ö 118
+sà118
+în 117
+pê 115
+td 114
+êc 114
+cb 113
+hc 111
+èn 107
+vä 106
+yy 105
+ö_ 105
+ár 104
+nä 103
+iñ 102
+nò 99
+iã 98
+äf 98
+pf 96
+kg 94
+tá 93
+ür 92
+pg 91
+fp 90
+äy 89
+yc 87
+aï 86
+gc 84
+üs 84
+nö 83
+wr 83
+xé 83
+iy 82
+äl 82
+ió 81
+tk 81
+cì 79
+hb 79
+mò 79
+tô 79
+sä 78
+rx 77
+î_ 77
+cv 76
+tp 75
+èl 75
+hô 74
+lr 74
+vm 74
+zr 74
+ña 74
+èv 73
+às 72
+ä_ 72
+ÃÂt 71
+hü 70
+pd 70
+cg 69
+hs 68
+vd 66
+bà65
+ât 65
+ûr 65
+dv 64
+pj 63
+sû 63
+ôm 62
+_Ã¥ 61
+_ó 61
+cô 61
+lò 61
+xf 60
+fà59
+vò 59
+xo 59
+dp 58
+gè 57
+md 57
+rã 57
+tâ 57
+pî 55
+rá 55
+râ 55
+çu 55
+éi 55
+bm 54
+dû 54
+tg 54
+vè 54
+ÃÂo 54
+yé 53
+zó 53
+öc 53
+mã 52
+èc 52
+bâ 51
+rì 51
+hp 50
+ïr 50
+oñ 49
+û_ 49
+eç 48
+jd 48
+pb 48
+Ã¥r 48
+gk 46
+uì 46
+ÃÂg 46
+aé 45
+bì 45
+cw 44
+eß 44
+qc 44
+eè 43
+kp 43
+ßl 43
+uê 42
+xh 42
+kö 41
+sù 41
+éh 41
+fb 40
+gv 40
+rj 40
+ìt 40
+mà39
+uè 39
+yá 39
+zk 39
+vn 38
+ìp 38
+bv 37
+lá 37
+lü 37
+tj 37
+uà37
+dù 36
+jm 36
+là36
+mw 36
+ái 36
+fd 35
+tó 35
+ú_ 35
+vg 34
+ól 34
+iú 33
+sz 33
+và33
+ël 33
+_ò 32
+cj 32
+vp 32
+ww 32
+zc 31
+Ã¥_ 31
+éé 31
+ìa 31
+aà30
+rú 30
+yg 30
+üt 30
+xu 29
+zò 29
+ác 29
+bp 28
+kw 28
+mk 28
+nì 28
+xq 28
+yw 28
+òd 28
+fó 27
+jü 27
+oî 27
+vê 27
+fk 26
+fù 26
+hf 26
+mv 26
+mö 26
+uß 26
+_â 25
+eå 25
+sã 25
+xy 25
+ÃÂs 25
+sø 24
+ï_ 24
+lj 23
+lw 23
+vy 23
+wü 23
+úa 23
+mó 22
+tü 22
+væ 22
+âg 22
+öv 22
+eò 21
+gw 21
+vá 21
+wc 21
+ª_ 21
+ßb 21
+ás 21
+Ã¥s 21
+æg 21
+çi 21
+øl 21
+_ª 20
+aë 20
+bf 20
+eï 20
+üd 20
+_ç 19
+_ì 19
+fü 19
+qi 19
+sü 19
+êo 19
+ôn 19
+iá 18
+jú 18
+mø 18
+sú 18
+wk 18
+úc 18
+kd 17
+oï 17
+pq 17
+qr 17
+äc 17
+_ø 16
+gò 16
+mä 16
+pô 16
+så 16
+zm 16
+ék 16
+ñi 16
+dó 15
+fû 15
+kb 15
+tì 15
+wf 15
+àl 15
+äi 15
+äs 15
+ús 15
+_î 14
+lx 14
+oë 14
+pì 14
+uç 14
+vì 14
+wb 14
+zy 14
+zé 14
+îl 14
+úi 14
+aè 13
+fh 13
+iß 13
+kc 13
+oé 13
+rä 13
+wd 13
+äu 13
+ìo 13
+ór 13
+aâ 12
+fá 12
+vb 12
+xl 12
+xw 12
+yf 12
+yv 12
+zp 12
+â_ 12
+èi 12
+öp 12
+_ß 11
+bg 11
+có 11
+gø 11
+hâ 11
+jv 11
+kü 11
+to_ 1500522
+_co 1392116
+_di 1389206
+_de 1385835
+ion 1312243
+re_ 1217116
+ne_ 1191969
+la_ 1171833
+ent 1117495
+di_ 1078978
+one 1010589
+le_ 967251
+_in 965325
+del 871439
+zio 842895
+che 826716
+_pr 823340
+ell 810579
+he_ 809052
+te_ 796055
+ti_ 777179
+con 775929
+_ch 720329
+_la 715041
+nte 707260
+men 698917
+_un 680154
+no_ 676491
+_e_ 641068
+per 632752
+_pe 595655
+azi 582478
+_qu 569919
+lla 564912
+_al 562023
+er_ 523320
+ta_ 522505
+are 517487
+li_ 497458
+_si 497128
+ame 492352
+in_ 486715
+com 486137
+_ri 485630
+_il 467671
+il_ 463887
+_no 459360
+nto 448268
+pro 445638
+on_ 443893
+sta 439510
+est 428998
+ni_ 426084
+pre 424396
+io_ 423022
+si_ 412172
+_pa 410173
+ato 403795
+ere 403529
+ssi 400413
+el_ 387924
+_po 386356
+_so 385360
+ess 378788
+res 377801
+ono 375059
+_ne 368529
+all 366941
+que 364799
+ia_ 364287
+ati 358008
+gli 356838
+ett 355574
+ter 353985
+ll_ 351099
+_se 349688
+ro_ 349362
+_a_ 348604
+tat 336513
+_re 332559
+rop 332418
+ra_ 329022
+_st 323738
+nti 320681
+un_ 318890
+tra 317706
+ale 316017
+mo_ 314752
+_da 314376
+_l_ 314087
+_su 313744
+par 313656
+tto 310840
+ost 310602
+na_ 309547
+att 308234
+ri_ 307829
+lle 307732
+ica 306205
+_le 300645
+tti 298852
+non 291757
+sio 289153
+_es 287347
+do_ 287078
+_è_ 283995
+ei_ 279417
+ant 278183
+oni 277237
+ali 274639
+ues 270992
+esi 266863
+me_ 265784
+pos 261893
+_p_ 260251
+ari 258984
+tà_ 258965
+so_ 252407
+se_ 250969
+_ma 248797
+lo_ 246853
+iam 245469
+sti 243806
+str 242663
+uro 235359
+ont 230915
+tiv 228951
+una 228873
+za_ 227506
+tic 227135
+_an 226653
+tta 226296
+enz 225703
+spe 225536
+_mo 224573
+nel 224542
+ma_ 222878
+ca_ 222650
+uni 221558
+rat 221071
+_me 217371
+_i_ 217185
+ide 216361
+nor 213551
+eur 213309
+ist 212650
+ten 212568
+nta 211826
+ore 211736
+mis 210749
+_eu 208926
+ico 208255
+eri 207488
+_mi 207320
+sto 207238
+_tr 205264
+ver 204521
+iss 203886
+ste 203125
+qua 200432
+amo 199286
+anc 199179
+mmi 199021
+col 197961
+ità197000
+omm 196314
+int 194848
+ope 193351
+vol 193096
+ons 192520
+era 191876
+al_ 191172
+den 190758
+tan 188845
+tar 187358
+_fa 187179
+rit 186722
+bil 185926
+lit 184786
+tro 184139
+ori 183927
+da_ 183672
+nza 182585
+cor 181866
+olt 181325
+utt 180445
+_sp 179963
+sid 178830
+sig 176694
+ris 176460
+ran 175409
+sen 175121
+end 175083
+oli 174722
+tor 174493
+ire 173552
+ese 173215
+sse 171871
+pea 171337
+_ci 170526
+son 169461
+ora 169266
+_ca 168633
+chi 168068
+ndo 166137
+iti 165879
+dei 164637
+ort 164595
+_te 163841
+tut 163666
+_do 161596
+ric 160838
+ann 160475
+ser 160449
+and 158219
+por 157452
+ito 156556
+ili 155917
+ita 155618
+der 155538
+ond 155508
+ssa 154832
+ntr 154544
+pri 154409
+_ha 153773
+rio 153112
+sul 152485
+_im 151527
+ano 151021
+ata 150561
+ina 150240
+gra 150223
+ci_ 148678
+sso 147632
+ome 147109
+izi 145397
+_tu 145351
+_na 144846
+art 144245
+_pi 143738
+ndi 143592
+ini 142226
+nzi 140997
+nsi 140376
+oss 140122
+_vo 139901
+gio 139590
+fic 138952
+for 138408
+ela 138024
+evo 137930
+zia 137218
+app 136954
+_vi 136758
+ggi 135497
+imp 134725
+rev 134611
+erc 134438
+tal 134428
+sia 134368
+dal 134178
+acc 133467
+gno 132148
+mi_ 131707
+nch 131236
+co_ 130798
+po_ 130583
+ura 130503
+dis 130381
+ass 129950
+nal 129367
+sar 129366
+va_ 128147
+ona 128069
+_ad 127721
+tre 126908
+sa_ 126851
+opo 126838
+ual 125417
+tri 125415
+ene 125384
+_fo 124555
+ate 124427
+anz 124164
+dir 123685
+arl 123313
+ria 122732
+rta 122516
+nda 122494
+_gi 122054
+zza 121932
+fin 121898
+tte 121580
+_ve 121375
+nno 120971
+ich 120941
+ien 120159
+ici 120128
+lio 120110
+ole 119207
+sol 118811
+rel 118054
+olo 117984
+man 117658
+iar 116818
+mpo 116724
+lam 116473
+vor 116329
+cia 115956
+ive 115410
+iva 115399
+isc 115378
+nam 115328
+ltr 115004
+ola 114923
+pol 114771
+de_ 114340
+ott 113985
+rla 113919
+itt 113636
+rre 113556
+_sa 113195
+ppo 113139
+nde 112976
+min 112904
+raz 112639
+ven 112226
+_fi 112218
+_pu 111881
+_ra 111351
+ea_ 111212
+_lo 111035
+tur 111002
+gua 110931
+ine 110794
+llo 109776
+_id 109062
+alt 108941
+_ta 108858
+mer 108825
+ign 108682
+ve_ 108174
+ani 107802
+lan 107691
+cos 107425
+_at 107309
+orm 107226
+_ap 107094
+ha_ 106969
+ime 106519
+rti 105985
+_gl 105332
+rim 105313
+_li 105015
+_ac 104461
+ero 104299
+_gr 103629
+rma 103445
+laz 103414
+nio 103302
+tit 102966
+_av 102325
+ers 102262
+ce_ 101722
+_as 101179
+nos 100525
+ior 100446
+ile 100278
+omp 100218
+ren 100021
+ial 99593
+uzi 99269
+cco 98981
+ces 98561
+nit 97784
+spo 97577
+igl 97279
+uto 96792
+ern 96374
+eme 96011
+id_ 95959
+bia 95920
+isp 95904
+orr 95485
+ui_ 94420
+ebb 94387
+iù_ 94294
+più 94154
+cat 93715
+ull 93713
+vo_ 93358
+_or 93212
+_on 93102
+ert 93000
+pet 91889
+ker 91619
+ara 91455
+inc 91409
+eci 90630
+ake 90572
+ivi 90550
+_am 90199
+eak 90046
+bbi 89520
+rte 89466
+tem 89372
+agg 89035
+ind 88811
+ord 88509
+itu 88344
+_cr 88074
+rà_ 87812
+nci 87479
+uan 87476
+vi_ 87375
+izz 86877
+oro 86358
+onc 86296
+avo 86045
+occ 85919
+ove 85016
+emp 84948
+lat 84772
+giu 84573
+ifi 84483
+omu 84121
+ie_ 84046
+ret 83970
+emb 83804
+egl 83780
+ral 83671
+oll 83592
+sit 83500
+leg 83457
+ttu 83087
+fer 82888
+ner 82838
+mat 82462
+bbe 81590
+ima 81072
+ue_ 80932
+abi 80884
+_va 80712
+osi 80227
+mun 80206
+or_ 80119
+ibi 80024
+eco 79684
+rie 79654
+car 78872
+_cu 78399
+reg 78237
+_sc 78183
+ai_ 78003
+ece 77956
+ens 77549
+reb 77268
+iat 76823
+cit 76244
+erm 76073
+lic 75937
+nat 75906
+cer 75274
+tua 74924
+rog 74829
+lar 74602
+dic 74569
+ede 74554
+cen 74418
+rar 74407
+ché 74222
+ivo 74190
+hé_ 74151
+_au 73649
+sem 73634
+gen 73619
+lta 73465
+mbr 73465
+tes 72976
+_ce 72913
+nco 72464
+_ai 72450
+upp 72215
+ino 72214
+iso 71906
+deg 71751
+ian 71644
+ult 71567
+lor 71254
+aff 70872
+aes 70794
+cre 70394
+odo 70387
+qui 70112
+rov 70035
+egi 70006
+ad_ 69824
+mod 69747
+pae 69700
+_ab 69688
+ure 69688
+imi 69334
+_nu 69012
+fat 68985
+rso 68662
+eve 68380
+go_ 68121
+des 68055
+_ag 67545
+amb 67545
+erv 67309
+hia 67101
+esp 67058
+isi 66851
+ram 66322
+_ba 66131
+err 66019
+_fr 65822
+_sv 65722
+mbi 65289
+imo 65159
+tam 65108
+ffi 64844
+rin 64761
+ite 64472
+dam 64328
+omi 64225
+nom 64208
+ema 64192
+sis 64099
+mol 63776
+edi 63711
+ge_ 62922
+ova 62595
+be_ 62427
+_ec 62371
+ppr 62342
+seg 62323
+dov 62321
+abb 62034
+pon 61903
+ard 61661
+rsi 61621
+via 61614
+iet 61594
+age 61462
+mpi 61224
+naz 61108
+alc 61091
+pot 60650
+_af 60641
+uta 60339
+dia 60174
+cui 60148
+opr 60109
+ezz 59989
+tim 59970
+vis 59845
+uti 59633
+ron 59574
+ice 59504
+bri 59368
+rea 59207
+far 59175
+pen 59162
+dev 58994
+din 58954
+inf 58941
+lto 58933
+_ar 58893
+ang 58735
+iri 58637
+sco 58254
+roc 58245
+unt 58129
+lem 57930
+uar 57922
+cce 57641
+mpr 57548
+van 57360
+nan 57304
+cio 56864
+lia 56822
+niz 56795
+lav 56156
+_du 56134
+uel 56123
+_en 56054
+oci 56038
+ngu 56005
+soc 55936
+rem 55912
+tin 55731
+ote 55685
+eo_ 55199
+egu 55147
+fon 54780
+sci 54483
+rca 54462
+mem 54450
+pli 54277
+tio 54227
+_oc 54184
+ume 54140
+div 54129
+ber 54064
+lme 53953
+vit 53657
+hi_ 53623
+rif 53298
+rig 52978
+ing 52934
+ors 52884
+nse 52864
+ave 52535
+mon 52511
+_el 52418
+_ge 52343
+ngo 52189
+sib 52013
+liz 51884
+ffe 51839
+taz 51834
+_og 51829
+_bi 51777
+sca 51754
+dat 51648
+ble 51549
+oi_ 51334
+emo 51292
+ras 51235
+rch 51230
+dif 51150
+rag 51091
+amm 51051
+egn 50915
+rme 50904
+hie 50601
+_em 50589
+ele 50490
+ger 50389
+rod 50363
+rda 50358
+lti 50070
+ego 49949
+can 49931
+rdi 49931
+rmi 49873
+sce 49748
+_op 49446
+mpe 49376
+cip 49367
+nic 49295
+uag 49266
+eng 49066
+uov 49066
+ier 49048
+ete 48952
+bie 48830
+eno 48789
+_be 48595
+_o_ 48540
+rno 48530
+cur 48523
+cun 48306
+nce 48244
+tru 48184
+sos 48151
+rec 47937
+oce 47759
+rob 47720
+peo 47706
+rdo 47450
+rci 47353
+ust 47343
+esc 47167
+sic 47065
+ogg 47022
+gia 46655
+adi 46274
+han 46243
+cis 46089
+dot 46044
+cri 45958
+rez 45743
+cam 45519
+zi_ 45458
+uss 45447
+nar 45443
+rap 45415
+_is 45331
+en_ 45294
+inv 45243
+onf 45239
+pa_ 45232
+olu 45114
+ze_ 44995
+cas 44867
+alm 44646
+eni 44604
+nis 44551
+fro 44520
+opp 44488
+isu 44368
+set 44365
+asp 44272
+rna 44187
+_d_ 44153
+_ed 44088
+dec 44086
+evi 44020
+_fu 44001
+lin 43930
+mpl 43901
+mar 43630
+nec 43627
+lcu 43286
+_lu 43217
+val 43172
+vil 43083
+dur 43018
+ogr 42852
+sim 42748
+icu 42636
+rei 42586
+scu 42567
+obl 42371
+teg 42369
+nuo 42353
+ccu 42074
+esa 42013
+orn 42003
+asi 41958
+iut 41699
+emi 41591
+su_ 41585
+iun 41543
+ovr 41490
+dar 41319
+ega 41082
+es_ 41072
+iò_ 41030
+rad 40981
+ciò 40975
+ed_ 40898
+igu 40792
+ros 40767
+ota 40600
+nze 40593
+opa 40389
+gni 40383
+lib 40338
+bli 40312
+ced 40290
+met 40227
+riv 40020
+cup 40012
+nve 39972
+ben 39866
+mic 39834
+pun 39812
+nsa 39729
+lim 39719
+eva 39683
+fra 39521
+agl 39486
+ua_ 39379
+vre 39256
+ila 39197
+ade 39186
+rto 39108
+mag 38972
+sec 38969
+det 38955
+rib 38756
+pes 38613
+nut 38574
+paz 38522
+ul_ 38470
+gan 38387
+bbl 38166
+bas 37965
+obb 37795
+avi 37793
+mes 37715
+gol 37689
+ado 37682
+atu 37598
+san 37569
+ius 37555
+cie 37544
+siz 37521
+eff 37416
+une 37405
+pia 37283
+red 37227
+upa 37046
+uno 36995
+gna 36830
+avv 36705
+ubb 36632
+_ef 36627
+vat 36557
+rol 36481
+enu 36405
+ute 36405
+mit 36126
+_ob 35903
+mig 35900
+let 35842
+sì_ 35836
+ga_ 35804
+nei 35732
+var 35420
+lte 35385
+gi_ 35348
+ins 35268
+ogn 35188
+svi 34967
+pio 34892
+don 34804
+amp 34802
+gar 34648
+lut 34603
+nni 34574
+ilu 34567
+ana 34550
+mme 34420
+rse 34274
+dim 34225
+lup 34072
+zaz 34016
+rid 33914
+aut 33908
+ida 33847
+uma 33702
+caz 33653
+ezi 33548
+uin 33497
+ena 33454
+uaz 33416
+eta 33393
+les 33252
+rup 33000
+gue 32945
+obi 32855
+ung 32842
+ace 32578
+get 32520
+_ho 32442
+oma 32292
+erà32281
+cus 32256
+tab 32218
+neg 32215
+mil 32163
+nol 32081
+odi 32054
+agi 32047
+tir 32041
+gru 31883
+ied 31846
+arm 31788
+vel 31641
+sua 31542
+edo 31422
+luz 31373
+vot 31343
+sot 31258
+ife 31242
+_ga 31239
+dan 31198
+pra 31151
+uò_ 31046
+può 31040
+idi 31013
+suo 30973
+nqu 30934
+sat 30828
+uri 30796
+sur 30735
+clu 30716
+ast 30664
+ved 30634
+_ev 30529
+lus 30513
+ava 30465
+med 30220
+aus 30201
+_ul 30144
+mma 30102
+diz 30096
+ià_ 30077
+già30062
+eal 29983
+log 29811
+osc 29761
+eti 29683
+nso 29683
+pub 29677
+ho_ 29650
+ibu 29599
+ane 29590
+rga 29584
+spi 29562
+vvi 29495
+ogl 29477
+sch 29469
+ghi 29455
+cca 29387
+gui 29345
+ibe 29268
+zat 29252
+lli 29232
+nia 29157
+ecc 29076
+rni 29073
+nfo 29063
+maz 28916
+fav 28800
+tec 28799
+cci 28727
+dit 28671
+noi 28658
+bit 28628
+nes 28503
+pi_ 28448
+orz 28434
+tav 28407
+tuz 28397
+_go 28330
+mio 28298
+ars 28290
+rro 28251
+gge 28191
+otr 28123
+osa 28114
+nge 28056
+tad 28054
+alu 28049
+iff 27968
+org 27913
+dob 27726
+ase 27710
+pas 27612
+rut 27547
+rne 27429
+inu 27344
+aro 27336
+erg 27310
+_er 27300
+vve 27223
+odu 27176
+uis 27175
+cap 27163
+rve 27100
+lie 26972
+dem 26967
+rav 26959
+_os 26851
+uo_ 26717
+usi 26706
+lis 26583
+ngr 26505
+gov 26496
+pie 26441
+efi 26409
+nea 26374
+nsu 26372
+agr 26351
+rom 26343
+ovi 26321
+ami 26246
+len 26232
+_ru 26162
+cra 26120
+uir 26116
+ipa 26099
+nga 26081
+edu 25982
+vid 25982
+fet 25839
+asc 25635
+oti 25615
+liv 25584
+ocr 25577
+cal 25575
+rvi 25524
+mal 25442
+tol 25431
+bre 25332
+_az 25296
+spa 25268
+sab 25257
+uit 25237
+ism 25176
+egg 25045
+til 25028
+_br 25018
+sor 24960
+_di_ 998932
+one_ 984358
+ione 954740
+_del 865281
+zion 809342
+che_ 803871
+_con 660337
+_che 636876
+ment 626708
+dell 582982
+_la_ 582505
+azio 547344
+_per 535155
+lla_ 534750
+nte_ 487446
+_in_ 473391
+_com 469098
+_il_ 459682
+are_ 458397
+nto_ 441111
+ente 424200
+_pro 397992
+amen 384606
+per_ 371186
+ella 338109
+ato_ 333428
+_que 331892
+_pre 315362
+ere_ 314615
+_un_ 308363
+ale_ 302218
+_non 289225
+sion 288471
+ento 280752
+del_ 274949
+non_ 272723
+_all 272522
+ques 270561
+pres 268807
+uest 267975
+_par 266109
+ioni 241999
+oni_ 241875
+lle_ 235983
+tto_ 228770
+_le_ 224077
+ell_ 222857
+ono_ 222054
+_nel 220233
+una_ 220141
+nti_ 220004
+_una 213415
+ati_ 212883
+gli_ 209935
+euro 209272
+_eur 208114
+_sta 205571
+ità_ 196996
+amo_ 196317
+ssio 194671
+urop 194088
+iamo 193739
+comm 192487
+_qua 191973
+sto_ 188457
+_si_ 186746
+enti 185167
+miss 181538
+_int 178658
+nza_ 177158
+mmis 173306
+ommi 171300
+sta_ 170731
+ali_ 170152
+stat 169924
+side 169658
+cons 167820
+elle 166782
+ica_ 165874
+dei_ 164466
+_dei 164465
+cont 163548
+inte 162384
+alla 157990
+issi 157076
+enta 155724
+_tra 155031
+rope 153546
+tti_ 150578
+iden 146857
+ano_ 146808
+_spe 145534
+esto 145463
+esid 144869
+ndo_ 142378
+dent 141007
+tutt 140786
+_pos 138585
+con_ 138251
+sono 135882
+enza 133994
+_ris 133132
+port 132622
+_imp 132169
+ata_ 131271
+_anc 131153
+ito_ 130409
+_uni 130358
+resi 129424
+_tut 129104
+_al_ 128641
+nter 128482
+tato 128110
+_dal 125570
+ire_ 124830
+_son 124492
+_sul 124171
+nell 123219
+tati 120649
+prop 119425
+ore_ 118793
+etto 117586
+rio_ 116559
+part 115585
+esse 114842
+_rel 114387
+rela 112839
+sso_ 112700
+etti 112483
+name 112325
+lame 111486
+anno 110810
+evol 110098
+nno_ 110031
+razi 109540
+_dir 109518
+tare 108927
+_dis 108621
+_ess 108553
+_da_ 108314
+anto 107926
+all_ 106738
+post 106327
+glio 105846
+_ha_ 105698
+esti 105280
+tant 105225
+arla 104429
+parl 104408
+anch 104336
+_att 104048
+_sig 103250
+sign 103250
+lazi 103222
+ome_ 102906
+ole_ 102643
+tori 102579
+ostr 101889
+nel_ 100695
+tro_ 99967
+nche 99423
+uzio 99205
+ame_ 98653
+comp 98560
+_gli 98006
+nion 98004
+sent 97462
+llo_ 96973
+igli 96845
+iona 96536
+_sia 96395
+ori_ 95716
+_cos 94870
+izio 94844
+_pri 94680
+esta 94560
+sser 94422
+più_ 94152
+_id_ 94147
+_più 93888
+_app 93654
+poss 93249
+poli 92900
+onsi 92785
+igno 92210
+gnor 91888
+ker_ 91235
+cess 91163
+bili 90751
+essi 90689
+_alt 90587
+rese 90528
+ttiv 90517
+revo 90433
+itic 90163
+_nam 90147
+aker 90109
+esso 90098
+spea 90066
+peak 90039
+eake 90034
+_pol 89871
+unio 89623
+_acc 89593
+tica 89383
+ile_ 88653
+ero_ 88173
+ontr 87857
+trat 87773
+come 87590
+ora_ 87022
+ico_ 86998
+_ric 86990
+ativ 86714
+rlam 86644
+orev 86572
+olit 86398
+sull 86348
+liti 85631
+orre 85042
+onal 84690
+qual 84685
+aggi 84605
+ria_ 84416
+orta 83989
+egli 83744
+tiva 83481
+quan 83209
+altr 83067
+lio_ 82172
+bbia 82035
+ropo 81987
+nore 81845
+ratt 81711
+stra 81597
+avor 81397
+ebbe 81355
+opea 81110
+pea_ 80934
+ario 80914
+vole 80588
+oro_ 80457
+onor 80358
+osta 80286
+ante 80214
+icol 80134
+_ono 80129
+_ma_ 79008
+izza 78723
+olo_ 78237
+dall 77874
+ific 77753
+ibil 77632
+comu 77428
+omun 77428
+_chi 77138
+_sol 77105
+rebb 76865
+tre_ 76659
+iva_ 76593
+abil 76155
+_fin 75982
+emen 75951
+esen 75631
+lità74876
+imen 74831
+conc 74811
+anti 74618
+ate_ 74538
+nost 74231
+ché_ 74149
+_tal 73886
+alle 73509
+ossi 73233
+elaz 72992
+dere 72929
+cono 72705
+tra_ 72581
+sia_ 72461
+biam 72258
+sere 71965
+form 71830
+embr 71811
+tico 71635
+rico 71557
+essa 71204
+fica 71130
+esi_ 71083
+ari_ 70847
+_for 70611
+opos 69866
+paes 69693
+_pae 69692
+arti 69647
+_col 69503
+cond 69018
+atti 68903
+tale 68857
+econ 68831
+ando 68745
+_reg 68670
+impo 68524
+ssar 68433
+rtan 68305
+_nos 68269
+_se_ 68227
+nor_ 68048
+_ad_ 67830
+_mod 67593
+mpor 67532
+uto_ 67512
+ntro 67362
+tere 67106
+chia 66636
+ator 66582
+tta_ 66071
+fatt 66021
+ine_ 65837
+etta 65833
+_ass 65589
+dire 65416
+tura 65350
+orma 64940
+ura_ 64738
+ppo_ 64719
+acco 64643
+ello 64582
+_gra 64427
+nsig 64297
+sigl 64278
+ener 64225
+_ver 63895
+sari 63738
+ste_ 63588
+unit 63525
+iche 63512
+anzi 63317
+uant 63297
+ende 63235
+atto 63188
+ambi 63176
+pett 62939
+nzia 62870
+spet 62739
+bile 62645
+ivo_ 62622
+sist 62324
+ress 61770
+ilit 61755
+ritt 61357
+ese_ 61234
+arte 61161
+nazi 61077
+ici_ 61025
+_mol 60870
+ggio 60867
+ient 60757
+iste 60695
+nale 60602
+prim 60551
+_dov 60228
+appr 60211
+utto 60077
+atta 60043
+tari 59948
+posi 59879
+enzi 59854
+cui_ 59682
+_abb 59611
+molt 59580
+rte_ 59534
+_cui 59468
+_deg 59303
+sti_ 59217
+_sen 59164
+isti 58898
+itar 58829
+bbe_ 58822
+tame 58602
+_inf 58457
+dame 58195
+_pot 57892
+indi 57847
+degl 57714
+nzio 57086
+_ind 56879
+teri 56598
+cord 56500
+stit 56116
+_giu 55893
+_dev 55579
+prog 55528
+nali 55520
+tivo 55273
+risp 55221
+quel 54997
+_aff 54912
+lto_ 54802
+_cre 54787
+tivi 54749
+uppo 54583
+irit 54285
+oste 54275
+abbi 53812
+diri 53746
+lmen 53728
+ini_ 53657
+tion 53657
+era_ 53538
+ntra 53436
+ccor 53252
+tore 53235
+_lan 53110
+_str 53086
+ntar 53065
+olto 52971
+ndam 52773
+lavo 52760
+_lav 52586
+cost 52465
+_mem 52431
+_occ 52219
+vers 52147
+ulla 52097
+titu 52005
+ncor 51995
+perc 51935
+proc 51930
+tata 51912
+tern 51856
+rett 51810
+memb 51769
+tazi 51738
+sibi 51665
+gior 51509
+oli_ 51491
+odo_ 51451
+rtic 51426
+iale 51348
+disc 51298
+ider 51170
+ltre 51142
+tri_ 50959
+attu 50914
+cent 50906
+rare 50810
+_ter 50664
+muni 50651
+_ci_ 50311
+_fat 50311
+ispo 50307
+utti 50176
+_sar 50065
+ondi 50026
+pera 50002
+ngua 49970
+entr 49969
+_far 49822
+chie 49819
+over 49756
+coll 49595
+aesi 49576
+_ai_ 49574
+ima_ 49527
+ffic 49455
+uell 49272
+_ann 49241
+guag 49239
+lang 49184
+angu 49014
+_mer 48956
+fond 48922
+ttor 48820
+rati 48709
+endo 48695
+soci 48581
+anza 48519
+age_ 48434
+dal_ 48149
+rsi_ 48148
+semp 48037
+mpre 47956
+opeo 47650
+peo_ 47634
+uage 47437
+ema_ 47373
+rno_ 47370
+_sos 47268
+cato 47005
+cial 46986
+loro 46984
+stru 46868
+cola 46826
+stri 46609
+cio_ 46396
+ondo 46363
+prob 46269
+osti 46202
+enda 46137
+atte 46074
+rdo_ 46064
+tali 46040
+uali 46017
+bri_ 45984
+_mi_ 45914
+ssa_ 45880
+este 45725
+mbri 45628
+_lo_ 45619
+ssi_ 45591
+lizz 45414
+rato 45352
+stan 45317
+lare 45289
+ssib 45258
+itti 45212
+ndi_ 45166
+erca 45160
+erso 45042
+onti 44991
+conf 44897
+nten 44840
+merc 44817
+_res 44771
+iame 44698
+corr 44680
+iare 44588
+stio 44421
+eces 44354
+ure_ 44304
+ront 44290
+nomi 44089
+olle 43958
+_vol 43798
+serv 43797
+sost 43755
+guar 43741
+assi 43737
+rso_ 43732
+imo_ 43671
+ntat 43666
+uale 43508
+sett 43474
+_nec 43462
+nece 43444
+alme 43370
+ttat 43315
+rend 43302
+alcu 43285
+lcun 43267
+_fon 43044
+volt 43030
+_alc 42960
+roce 42947
+zza_ 42853
+_soc 42808
+olta 42755
+_amb 42751
+_han 42720
+mina 42700
+uard 42537
+_set 42472
+hann 42444
+gion 42420
+ichi 42339
+ene_ 42259
+ita_ 42235
+_sem 42229
+robl 42184
+ette 42167
+dott 42163
+nder 42136
+lica 42081
+sse_ 42066
+_esp 41931
+segu 41891
+oble 41719
+prov 41698
+_dec 41653
+fici 41611
+blem 41610
+ivi_ 41585
+elat 41579
+iti_ 41555
+onom 41512
+_su_ 41468
+rre_ 41444
+_tem 41347
+modo 41333
+hiar 41325
+fron 41275
+aria 41224
+_rig 41200
+_rif 41070
+_nuo 41008
+sten 40990
+nde_ 40975
+ciò_ 40974
+ezza 40924
+tenz 40916
+otto 40822
+ecis 40770
+_man 40765
+olar 40740
+sicu 40740
+icur 40737
+_eme 40722
+nuov 40668
+opri 40579
+_cor 40425
+_eco 40414
+tras 40358
+icat 40354
+spon 40325
+nanz 40209
+_ed_ 40003
+rei_ 39990
+nze_ 39861
+erch 39854
+senz 39809
+rie_ 39808
+ropr 39745
+onse 39725
+_inc 39657
+ropa 39646
+lleg 39634
+issa 39578
+terr 39550
+_lor 39547
+agli 39471
+rogr 39444
+onte 39405
+_mon 39313
+_qui 39269
+ive_ 39228
+mini 39205
+_des 39056
+_rit 38978
+onda 38887
+iano 38886
+istr 38817
+occu 38763
+ispe 38739
+_div 38640
+deci 38595
+oper 38540
+ccup 38461
+punt 38369
+_rap 38366
+plic 38336
+opa_ 38317
+bbli 38156
+ttua 38150
+_ser 38111
+colo 38082
+ili_ 37976
+rima 37838
+sul_ 37835
+pazi 37732
+inan 37623
+sizi 37514
+dovr 37395
+ino_ 37351
+stro 37349
+rezz 37347
+eno_ 37295
+_ciò 37075
+mani 37046
+fina 37038
+regi 37005
+cupa 36936
+tter 36909
+rale 36876
+uno_ 36870
+cora 36796
+rché 36725
+disp 36682
+solu 36645
+_leg 36642
+oggi 36639
+atic 36619
+eve_ 36578
+_pun 36551
+_eff 36543
+_inv 36321
+ocia 36284
+siam 36221
+mend 36216
+rann 36018
+anco 35995
+izia 35927
+igua 35898
+utta 35872
+isio 35842
+_est 35830
+inci 35794
+gno_ 35772
+rigu 35738
+ussi 35669
+_ese 35623
+osiz 35597
+eria 35447
+unto 35440
+tive 35415
+tten 35380
+_cer 35357
+ani_ 35264
+uro_ 35249
+une_ 35231
+rova 35228
+via_ 35189
+prod 35168
+erna 35165
+renz 35103
+pare 35042
+_val 34976
+nei_ 34870
+tte_ 34833
+_ave 34782
+_svi 34745
+tanz 34739
+ntal 34735
+temp 34711
+_ven 34667
+_cit 34664
+_vor 34593
+vorr 34585
+erci 34573
+anci 34564
+iscu 34563
+_dif 34510
+ordi 34481
+_mag 34442
+_bas 34380
+onta 34375
+_ben 34304
+ista 34272
+vent 34231
+oppo 34134
+zzaz 34014
+zazi 34010
+svil 33922
+pers 33904
+lupp 33900
+vilu 33844
+ilup 33843
+riso 33796
+_nei 33789
+sare 33704
+graz 33627
+rto_ 33611
+_gen 33547
+cazi 33547
+_fra 33424
+uazi 33380
+_car 33369
+tene 33365
+pio_ 33329
+eri_ 33311
+lta_ 33290
+iret 33272
+anda 33191
+giun 33153
+voro 33125
+rand 33111
+otta 33089
+pert 33033
+erta 33030
+_sec 32984
+tess 32958
+ramm 32956
+iali 32918
+rapp 32880
+ziar 32855
+vere 32810
+magg 32768
+acce 32749
+lati 32746
+umen 32738
+eral 32653
+tich 32640
+_ste 32636
+iari 32622
+ggi_ 32574
+aran 32541
+_rea 32464
+dive 32370
+denz 32358
+spos 32338
+tuaz 32323
+erà_ 32280
+seco 32274
+_cas 32234
+desi 32228
+erno 32181
+vist 32132
+eraz 32101
+iver 32092
+rupp 32077
+zia_ 32063
+_ins 32013
+_de_ 31991
+que_ 31969
+mpo_ 31868
+stes 31854
+_ogg 31853
+ogra 31844
+enut 31810
+_min 31806
+iati 31765
+_det 31616
+nizi 31596
+rime 31596
+_ele 31581
+grup 31522
+rego 31457
+itta 31404
+rrei 31358
+_vot 31329
+rite 31329
+deve 31304
+gran 31279
+eder 31236
+ordo 31193
+uti_ 31132
+sott 31125
+quin 31081
+_seg 31067
+iniz 31060
+icaz 31045
+può_ 31040
+_può 31039
+_sot 31014
+ssim 30970
+ppro 30960
+ezio 30948
+_gru 30902
+_suo 30882
+colt 30867
+ziat 30858
+luzi 30845
+oluz 30844
+omic 30825
+nda_ 30728
+care 30727
+_ten 30725
+omen 30647
+nita 30603
+oltr 30600
+aliz 30578
+_ist 30570
+rito 30509
+ppre 30455
+_aut 30424
+ersi 30421
+tual 30378
+nità30362
+anni 30348
+gio_ 30293
+_lib 30272
+rti_ 30162
+egol 30127
+ater 30065
+già_ 30062
+_già30061
+ermi 30053
+nora 30012
+nere 29961
+_sic 29924
+_neg 29907
+_ult 29895
+tent 29888
+dizi 29835
+emi_ 29753
+tito 29749
+_esi 29738
+rant 29677
+_gio 29654
+trib 29631
+_tro 29629
+dera 29610
+engo 29543
+prio 29538
+lanc 29533
+peri 29528
+blic 29516
+ribu 29472
+zio_ 29464
+ogli 29447
+solo 29426
+_mat 29424
+arda 29412
+prev 29313
+erma 29295
+lato 29288
+cisi 29239
+ubbl 29238
+pubb 29233
+stre 29193
+itto 29165
+citt 29139
+aver 29085
+fine 29060
+migl 29048
+pren 29043
+_por 28983
+enze 28977
+ster 28958
+gram 28844
+rali 28809
+mett 28701
+mazi 28638
+arie 28631
+term 28616
+favo 28579
+tabi 28571
+ensi 28516
+_noi 28510
+rcat 28465
+noi_ 28443
+_ho_ 28424
+_fav 28328
+pens 28293
+ffer 28250
+_rag 28249
+gere 28248
+pote 28201
+rest 28191
+obbi 28164
+_sua 28153
+orme 28146
+auto 28071
+asso 28055
+nfor 28052
+voli 28044
+_avv 28024
+medi 27985
+hied 27970
+sua_ 27941
+adin 27930
+unic 27912
+rità27892
+_mis 27841
+rich 27785
+_ora 27751
+tend 27723
+_dob 27715
+dobb 27709
+ghi_ 27702
+real 27687
+tadi 27674
+ngo_ 27648
+mio_ 27639
+_pen 27635
+itua 27625
+gene 27580
+ande 27578
+cuss 27570
+espo 27570
+ural 27566
+cert 27560
+onos 27560
+ivel 27554
+rse_ 27532
+_cri 27507
+ltri 27497
+uni_ 27494
+_dic 27483
+gett 27442
+ttur 27424
+scus 27403
+nist 27298
+nta_ 27239
+alit 27211
+_ini 27193
+rmin 27193
+iene 27167
+_naz 27149
+tuzi 27123
+_mig 27100
+ituz 27098
+_sit 27090
+once 27081
+iber 27061
+_men 27004
+ttad 26968
+lega 26909
+erio 26891
+isol 26891
+libe 26883
+ltro 26785
+vern 26783
+cors 26762
+tema 26742
+ovre 26724
+mate 26673
+ppor 26644
+lett 26599
+gola 26592
+ilan 26587
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/hu.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/hu.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/hu.ngp (working copy)
@@ -1,6 +1,4 @@
# NgramProfile generated at Sat Sep 25 16:29:28 EEST 2004 for Nutch Language Identification
-ngram_count 6700159
-_ 338801
e 252504
a 217016
t 195530
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/NGramProfile.java
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/NGramProfile.java (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/NGramProfile.java (working copy)
@@ -13,29 +13,34 @@
* See the License for the specific language governing permissions and
* limitations under the License.
*/
-
package org.apache.nutch.analysis.lang;
-import java.io.BufferedInputStream;
+// JDK imports
+import java.io.File;
+import java.io.InputStream;
+import java.io.IOException;
+import java.io.OutputStream;
import java.io.BufferedReader;
-import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
-import java.io.IOException;
-import java.io.InputStream;
import java.io.InputStreamReader;
-import java.io.OutputStream;
+import java.io.BufferedInputStream;
import java.util.Date;
+import java.util.List;
+import java.util.Iterator;
+import java.util.ArrayList;
import java.util.Collections;
-import java.util.Hashtable;
-import java.util.Iterator;
-import java.util.Vector;
+import java.util.HashMap;
+import java.util.Map;
import java.util.logging.Logger;
+// Nutch imports
import org.apache.nutch.util.LogFormatter;
+// Lucene imports
import org.apache.lucene.analysis.Token;
+
/**
* This class runs a ngram analysis over submitted text, results might be used
* for automatic language identifiaction.
@@ -45,257 +50,230 @@
* Methods are provided to build new NGramProfiles profiles.
*
* @author Sami Siren
+ * @author Jerome Charron - http://frutch.free.fr/
*/
public class NGramProfile {
public static final Logger LOG = LogFormatter
.getLogger("org.apache.nutch.analysis.lang.NGramProfile");
- private String name;
+ /** The minimum length allowed for a ngram. */
+ final static int ABSOLUTE_MIN_NGRAM_LENGTH = 1;
- private Vector sorted = null;
+ /** The maximum length allowed for a ngram. */
+ final static int ABSOLUTE_MAX_NGRAM_LENGTH = 4;
+
+ /** The default min length of ngram */
+ final static int DEFAULT_MIN_NGRAM_LENGTH = 3;
- private StringBuffer tokensb = new StringBuffer();
+ /** The default max length of ngram */
+ final static int DEFAULT_MAX_NGRAM_LENGTH = 3;
- private int min_ngram_length = DEFAULT_MIN_NGRAM_LENGTH;
+ /** The ngram profile file extension */
+ static final String FILE_EXTENSION = "ngp";
- private int max_ngram_length = DEFAULT_MAX_NGRAM_LENGTH;
+ /** The profile max size (number of ngrams of the same size) */
+ static final int MAX_SIZE = 1000;
- private int ngramcount = 0;
+ /** separator char */
+ static final char SEPARATOR = '_';
+ /** The String form of the separator char */
+ private final static String SEP_CHARSEQ = new String(new char[] { SEPARATOR });
- static final String NGRAM_FILE_EXTENSION = "ngp";
+
+ /** The profile's name */
+ private String name = null;
- static final int NGRAM_LENGTH = 1000;
+ /** The NGrams of this profile sorted on the number of occurences */
+ private List sorted = null;
- //separator char
- static final char SEPARATOR = '_';
+ /** The min length of ngram */
+ private int minLength = DEFAULT_MIN_NGRAM_LENGTH;
- //default min length of ngram
- static final int DEFAULT_MIN_NGRAM_LENGTH = 1;
+ /** The max length of ngram */
+ private int maxLength = DEFAULT_MAX_NGRAM_LENGTH;
- //default max length of ngram
- static final int DEFAULT_MAX_NGRAM_LENGTH = 4;
+ /** The total number of ngrams occurences */
+ private int ngramcount = 0;
- //table to store ngrams
- Hashtable ngrams = null;
+ /** An index of the ngrams of the profile */
+ private Map ngrams = null;
+ /** A StringBuffer used during analysis */
+ private QuickStringBuffer word = new QuickStringBuffer();
+
+
/**
- * private class used to store NGramEntry
+ * Construct a new ngram profile
+ *
+ * @param name is the name of the profile
+ * @param minlen is the min length of ngram sequences
+ * @param maxlen is the max length of ngram sequences
*/
- class NGramEntry implements Comparable {
- private CharSequence seq;
-
- private int count;
-
- private float normalized_count;
-
- public NGramEntry(CharSequence seq) {
- this.seq = seq;
- }
-
- /**
- * @param ngramsequence
- * @param ngramcount
- */
- public NGramEntry(String ngramsequence, int ngramcount) {
- seq = new StringBuffer(ngramsequence).subSequence(0, ngramsequence
- .length());
- this.count = ngramcount;
- }
-
- public int getCount() {
- return count;
- }
-
- public CharSequence getSeq() {
- return seq;
- }
-
- public int compareTo(Object o) {
- if (((NGramEntry) o).count - count != 0)
- return ((NGramEntry) o).count - count;
- else
- return (seq.toString().compareTo(((NGramEntry) o).seq.toString()));
- }
-
- public void inc() {
- count++;
- }
+ public NGramProfile(String name, int minlen, int maxlen) {
+ // TODO: Compute the initial capacity using minlen and maxlen.
+ this.ngrams = new HashMap(4000);
+ this.minLength = minlen;
+ this.maxLength = maxlen;
+ this.name = name;
}
/**
- * Construct a new ngram profile
+ * @return Returns the name.
+ */
+ public String getName() {
+ return name;
+ }
+
+ /**
+ * Add ngrams from a token to this profile
*
- * @param name
- * Name of profile
+ * @param t is the Token to be added
*/
- public NGramProfile(String name) {
- this(name, DEFAULT_MIN_NGRAM_LENGTH, DEFAULT_MAX_NGRAM_LENGTH);
+ public void add(Token t) {
+ add(new StringBuffer().append(SEPARATOR)
+ .append(t.termText())
+ .append(SEPARATOR));
}
/**
- * Construct a new ngram profile
+ * Add ngrams from a single word to this profile
*
- * @param name
- * Name of profile
- * @param minlen
- * min length of ngram sequences
- * @param maxlen
- * max length of ngram sequences
+ * @param word is the word to add
*/
- public NGramProfile(String name, int minlen, int maxlen) {
- ngrams = new Hashtable();
- this.max_ngram_length = maxlen;
- this.min_ngram_length = minlen;
- this.name = name;
+ public void add(StringBuffer word) {
+ for (int i=minLength; (i <= maxLength) && (i < word.length()); i++) {
+ add(word, i);
+ }
}
/**
- * Add ngrams from a token to this profile
- *
- * @param t
- * Token to be added
+ * Add the last NGrams from the specified word.
*/
- public void addFromToken(Token t) {
- tokensb.setLength(0);
- tokensb.append(SEPARATOR).append(t.termText()).append(SEPARATOR);
- addNGrams(tokensb);
+ private void add(QuickStringBuffer word) {
+ int wlen = word.length();
+ if (wlen >= minLength) {
+ int max = Math.min(maxLength, wlen);
+ for (int i=minLength; i<=max; i++) {
+ add(word.subSequence(wlen-i, wlen));
+ }
+ }
}
+
+ /**
+ * Add ngrams from a single word in this profile
+ *
+ * @param word is the word to add
+ * @param n is the ngram size
+ */
+ private void add(CharSequence cs) {
+ if (cs.equals(SEP_CHARSEQ)) { return; }
+ NGramEntry nge = (NGramEntry) ngrams.get(cs);
+ if (nge == null) {
+ nge = new NGramEntry(cs);
+ ngrams.put(cs, nge);
+ }
+ nge.inc();
+ }
+
/**
* Analyze a piece of text
*
- * @param text
- * the text to be analyzed
+ * @param text the text to be analyzed
*/
public void analyze(StringBuffer text) {
- StringBuffer word;
- int i;
if (ngrams != null) {
ngrams.clear();
+ sorted = null;
}
- word = new StringBuffer().append(SEPARATOR);
- for (i = 0; i < text.length(); i++) {
+ word.clear().append(SEPARATOR);
+ for (int i = 0; i < text.length(); i++) {
char c = Character.toLowerCase(text.charAt(i));
if (Character.isLetter(c)) {
- word.append(c);
+ add(word.append(c));
} else {
//found word boundary
if (word.length() > 1) {
//we have a word!
- word.append(SEPARATOR);
- addNGrams(word);
- word.delete(0, word.length());
+ add(word.append(SEPARATOR));
+ word.clear().append(SEPARATOR);
}
}
}
if (word.length() > 1) {
- //we have a last word
- word.append(SEPARATOR);
- addNGrams(word);
+ //we have a word!
+ add(word.append(SEPARATOR));
}
normalize();
}
/**
- * Normalize profile
+ * @param word
+ * @param n sequence length
*/
+ private void add(StringBuffer word, int n) {
+ for (int i=0; i <= word.length()-n; i++) {
+ add(word.subSequence(i, i + n));
+ }
+ }
+
+ /**
+ * Normalize the profile (calculates the ngrams frequencies)
+ */
protected void normalize() {
- Vector sorted = getSorted();
+ List sorted = getSorted();
int sum = 0;
- //only calculate ngramcount if it was not available in profile
+ // Calculate ngramcount if not already done
if (ngramcount == 0) {
- for (int i = 0; i < sorted.size(); i++) {
+ for (int i=0; i < sorted.size(); i++) {
ngramcount += ((NGramEntry) sorted.get(i)).count;
}
}
- if (sorted.size() > 0) {
- Iterator i = sorted.iterator();
-
- while (i.hasNext()) {
- NGramEntry e = (NGramEntry) i.next();
- e.normalized_count = e.count / (float)ngramcount;
- }
+ Iterator i = sorted.iterator();
+ while (i.hasNext()) {
+ NGramEntry e = (NGramEntry) i.next();
+ e.frequency = e.count / (float) ngramcount;
}
}
/**
- * Add ngrams from a single word to this profile
+ * Return a sorted list of ngrams (sort done by 1. count 2. sequence)
*
- * @param word
- */
- public void addNGrams(StringBuffer word) {
- int i;
-
- for (i = min_ngram_length; i <= max_ngram_length && i < word.length(); i++) {
- addNGrams(word, i);
- }
- }
-
- /**
- * @param word
- * @param n
- * sequence length
- */
- private void addNGrams(StringBuffer word, int n) {
- NGramEntry nge;
- StringBuffer sb;
- int i;
-
- for (i = 0; i <= word.length() - n; i++) {
-
- CharSequence cs = word.subSequence(i, i + n);
-
- if (ngrams.containsKey(cs)) {
- nge = (NGramEntry) ngrams.get(cs);
- } else {
- nge = new NGramEntry(cs);
- }
- nge.inc();
- ngrams.put(cs, nge);
- }
- }
-
- /**
- * Return sorted vector of ngrams (sort done by 1. count 2. sequence)
- *
* @return sorted vector of ngrams
*/
- public Vector getSorted() {
- //make sure srting is done only once
+ public List getSorted() {
+ // make sure sorting is done only once
if (sorted == null) {
- sorted = new Vector(ngrams.values());
+ sorted = new ArrayList(ngrams.values());
Collections.sort(sorted);
- //trim at NGRAM_LENGTH entries
- if (sorted.size() > NGRAM_LENGTH)
- sorted.setSize(NGRAM_LENGTH);
+ // trim at NGRAM_LENGTH entries
+ if (sorted.size() > MAX_SIZE) {
+ sorted = sorted.subList(0, MAX_SIZE);
+ }
}
-
return sorted;
}
-
- /**
- * Return ngramprofile as text
- *
- * @return ngramprofile as text
- */
+
+ // Inherited JavaDoc
public String toString() {
- StringBuffer s = new StringBuffer();
+ StringBuffer s = new StringBuffer().append("NGramProfile: ")
+ .append(name).append("\n");
+
Iterator i = getSorted().iterator();
- s.append("NGramProfile: ").append(name).append("\n");
while (i.hasNext()) {
NGramEntry entry = (NGramEntry) i.next();
- s.append(entry.count).append(':').append(entry.seq).append(" ").append(
- entry.normalized_count).append("\n");
+ s.append(entry.count).append(':').append(entry.seq).append(" ")
+ .append(entry.frequency).append("\n");
}
return s.toString();
}
@@ -308,6 +286,7 @@
* @return similarity 0=exact match
*/
public float getSimilarity(NGramProfile another) {
+
float sum = 0;
try {
@@ -315,21 +294,20 @@
while (i.hasNext()) {
NGramEntry other = (NGramEntry) i.next();
if (ngrams.containsKey(other.seq)) {
- sum += Math.abs((other.normalized_count - ((NGramEntry) ngrams
- .get(other.seq)).normalized_count)) / 2;
+ sum += Math.abs((other.frequency -
+ ((NGramEntry) ngrams.get(other.seq)).frequency)) / 2;
} else {
- sum += other.normalized_count;
+ sum += other.frequency;
}
}
i = getSorted().iterator();
while (i.hasNext()) {
NGramEntry other = (NGramEntry) i.next();
if (another.ngrams.containsKey(other.seq)) {
- sum += Math
- .abs((other.normalized_count - ((NGramEntry) another.ngrams
- .get(other.seq)).normalized_count)) / 2;
+ sum += Math.abs((other.frequency -
+ ((NGramEntry) another.ngrams.get(other.seq)).frequency)) / 2;
} else {
- sum += other.normalized_count;
+ sum += other.frequency;
}
}
} catch (Exception e) {
@@ -339,27 +317,28 @@
}
/**
- * Loads a ngram profile from InputStream (assumes UTF-8 encoded content)
+ * Loads a ngram profile from an InputStream
+ * (assumes UTF-8 encoded content)
+ * @param is the InputStream to read
*/
public void load(InputStream is) throws IOException {
- BufferedReader bis = new BufferedReader(new InputStreamReader(is, "UTF-8"));
- String line;
ngrams.clear();
+ BufferedReader reader = new BufferedReader(new InputStreamReader(is, "UTF-8"));
+ String line = null;
- while ((line = bis.readLine()) != null) {
+ while ((line = reader.readLine()) != null) {
// # starts a comment line
if (line.charAt(0) != '#') {
int spacepos = line.indexOf(' ');
String ngramsequence = line.substring(0, spacepos).trim();
- int ngramcount = Integer.parseInt(line.substring(spacepos + 1));
-
- if (!line.startsWith("ngram_count")) {
- NGramEntry en = new NGramEntry(ngramsequence, ngramcount);
- ngrams.put(en.getSeq(), en);
- } else {
- this.ngramcount = ngramcount;
+ if ((ngramsequence.length() >= minLength) &&
+ (ngramsequence.length() <= maxLength)) {
+ int ngramcount = Integer.parseInt(line.substring(spacepos + 1));
+ NGramEntry en = new NGramEntry(ngramsequence, ngramcount);
+ ngrams.put(en.getSeq(), en);
+ this.ngramcount += ngramcount;
}
}
}
@@ -369,16 +348,14 @@
/**
* Create a new Language profile from (preferably quite large) text file
*
- * @param name
- * name of profile
- * @param is
- * @param encoding
- * encoding of stream
+ * @param name is thename of profile
+ * @param is is the stream to read
+ * @param encoding is the encoding of stream
*/
- public static NGramProfile createNgramProfile(String name, InputStream is,
- String encoding) {
+ public static NGramProfile create(String name, InputStream is, String encoding) {
- NGramProfile newProfile = new NGramProfile(name);
+ NGramProfile newProfile = new NGramProfile(name, ABSOLUTE_MIN_NGRAM_LENGTH,
+ ABSOLUTE_MAX_NGRAM_LENGTH);
BufferedInputStream bis = new BufferedInputStream(is);
byte buffer[] = new byte[4096];
@@ -394,7 +371,6 @@
}
newProfile.analyze(text);
-
return newProfile;
}
@@ -402,25 +378,42 @@
* Writes NGramProfile content into OutputStream, content is outputted with
* UTF-8 encoding
*
- * @param os
- * Stream to output to
+ * @param os the Stream to output to
* @throws IOException
*/
-
public void save(OutputStream os) throws IOException {
- Vector v = getSorted();
- Iterator i = v.iterator();
- os
- .write(("# NgramProfile generated at " + new Date() + " for Nutch Language Identification\n")
- .getBytes());
- os.write(("ngram_count " + ngramcount + "\n").getBytes());
- while (i.hasNext()) {
- NGramEntry e = (NGramEntry) i.next();
- String line = e.getSeq().toString() + " " + e.getCount() + "\n";
+ // Write header
+ os.write(("# NgramProfile generated at " + new Date() +
+ " for Nutch Language Identification\n").getBytes());
+
+ // And then each ngram
+
+ // First dispatch ngrams in many lists depending on their size
+ // (one list for each size, in order to store MAX_SIZE ngrams for each
+ // size of ngram)
+ int count = 0;
+ List list = new ArrayList();
+ List sublist = new ArrayList();
+ NGramEntry[] entries = (NGramEntry[]) ngrams.values().toArray(new NGramEntry[ngrams.size()]);
+ for (int i=minLength; i<=maxLength; i++) {
+ for (int j=0; j MAX_SIZE) {
+ sublist = sublist.subList(0, MAX_SIZE);
+ }
+ list.addAll(sublist);
+ sublist.clear();
+ }
+ for (int i=0; i newCapacity) {
+ newCapacity = minimumCapacity;
+ }
+
+ char newValue[] = new char[newCapacity];
+ System.arraycopy(value, 0, newValue, 0, count);
+ value = newValue;
+ }
+
+ QuickStringBuffer clear() {
+ count = 0;
+ return this;
+ }
+
+ public char charAt(int index) {
+ return value[index];
+ }
+
+ QuickStringBuffer append(String str) {
+ if (str == null) {
+ str = String.valueOf(str);
+ }
+
+ int len = str.length();
+ int newcount = count + len;
+ if (newcount > value.length) {
+ expandCapacity(newcount);
+ }
+ str.getChars(0, len, value, count);
+ count = newcount;
+ return this;
+ }
+
+ QuickStringBuffer append(char c) {
+ int newcount = count + 1;
+ if (newcount > value.length) {
+ expandCapacity(newcount);
+ }
+ value[count++] = c;
+ return this;
+ }
+
+ public CharSequence subSequence(int start, int end) {
+ return new String(value, start, end - start);
+ }
+
+ public String toString() {
+ return new String(this.value);
+ }
}
+
+
}
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/LanguageIdentifier.java
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/LanguageIdentifier.java (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/LanguageIdentifier.java (working copy)
@@ -15,83 +15,161 @@
*/
package org.apache.nutch.analysis.lang;
+// JDK imports
+import java.io.File;
+import java.io.InputStream;
+import java.io.IOException;
import java.io.BufferedReader;
-import java.io.File;
import java.io.FileInputStream;
-import java.io.IOException;
-import java.io.InputStream;
import java.io.InputStreamReader;
+import java.util.List;
+import java.util.Vector;
+import java.util.HashMap;
import java.util.Iterator;
-import java.util.Vector;
+import java.util.ArrayList;
+import java.util.Collections;
+import java.util.Properties;
+import java.util.Enumeration;
import java.util.logging.Logger;
+// Nutch imports
import org.apache.nutch.fetcher.FetcherOutput;
+import org.apache.nutch.indexer.IndexingFilter;
import org.apache.nutch.indexer.IndexingException;
-import org.apache.nutch.indexer.IndexingFilter;
import org.apache.nutch.parse.Parse;
-import org.apache.nutch.parse.ParseException;
import org.apache.nutch.parse.Parser;
import org.apache.nutch.parse.ParserFactory;
+import org.apache.nutch.parse.ParseException;
import org.apache.nutch.parse.ParserNotFound;
import org.apache.nutch.protocol.Content;
import org.apache.nutch.protocol.Protocol;
-import org.apache.nutch.protocol.ProtocolException;
import org.apache.nutch.protocol.ProtocolFactory;
import org.apache.nutch.protocol.ProtocolNotFound;
+import org.apache.nutch.protocol.ProtocolException;
+import org.apache.nutch.util.NutchConf;
import org.apache.nutch.util.LogFormatter;
+import org.apache.nutch.analysis.lang.NGramProfile.NGramEntry;
+// Lucene imports
+import org.apache.lucene.document.Field;
import org.apache.lucene.document.Document;
-import org.apache.lucene.document.Field;
-import java.util.Properties;
-import java.util.Enumeration;
+
/**
*
* @author Sami Siren
- *
+ * @author Jerome Charron - http://frutch.free.fr/
*/
public class LanguageIdentifier implements IndexingFilter {
- public static final Logger LOG = LogFormatter.getLogger("org.apache.nutch.analysis.lang.LanguageIdentifier");
+
+
+ private final static int DEFAULT_ANALYSIS_LENGTH = 0; // 0 means full content
+
+ private final static float SCORE_THRESOLD = 0.00F;
- private Vector languages = new Vector();
+ public final static Logger LOG = LogFormatter.getLogger(LanguageIdentifier.class.getName());
- private Vector supportedLanguages = new Vector();
+
+ private ArrayList languages = new ArrayList();
- private static LanguageIdentifier identifier = new LanguageIdentifier(true);
+ private ArrayList supportedLanguages = new ArrayList();
- private static float SCORE_THRESOLD = 0.00F;
+ /** Minimum size of NGrams */
+ private int minLength = NGramProfile.DEFAULT_MIN_NGRAM_LENGTH;
+
+ /** Maximum size of NGrams */
+ private int maxLength = NGramProfile.DEFAULT_MAX_NGRAM_LENGTH;
+
+ /** The maximum amount of data to analyze */
+ private int analyzeLength = DEFAULT_ANALYSIS_LENGTH;
+
+ /** A global index of ngrams of all supported languages */
+ private HashMap ngramsIdx = new HashMap();
- //public constructor needed for extension mechanism
- public LanguageIdentifier() {}
+ /** The NGramProfile used for identification */
+ private NGramProfile suspect = null;
- private LanguageIdentifier(boolean fake) {
+ /** My singleton instance */
+ private static LanguageIdentifier identifier = null;
+
+
+ /**
+ * Constructs a new Language Identifier.
+ */
+ private LanguageIdentifier() {
+
+ // Gets ngram sizes to take into account from the Nutch Config
+ minLength = NutchConf.get().getInt("lang.ngram.min.length",
+ NGramProfile.DEFAULT_MIN_NGRAM_LENGTH);
+ maxLength = NutchConf.get().getInt("lang.ngram.max.length",
+ NGramProfile.DEFAULT_MAX_NGRAM_LENGTH);
+ // Ensure the min and max values are in an acceptale range
+ // (ie min >= DEFAULT_MIN_NGRAM_LENGTH and max <= DEFAULT_MAX_NGRAM_LENGTH)
+ maxLength = Math.min(maxLength, NGramProfile.ABSOLUTE_MAX_NGRAM_LENGTH);
+ maxLength = Math.max(maxLength, NGramProfile.ABSOLUTE_MIN_NGRAM_LENGTH);
+ minLength = Math.max(minLength, NGramProfile.ABSOLUTE_MIN_NGRAM_LENGTH);
+ minLength = Math.min(minLength, maxLength);
+
+ // Gets the value of the maximum size of data to analyze
+ analyzeLength = NutchConf.get().getInt("lang.analyze.max.length",
+ DEFAULT_ANALYSIS_LENGTH);
+
Properties p = new Properties();
try {
p.load(this.getClass().getResourceAsStream("langmappings.properties"));
Enumeration alllanguages = p.keys();
+
+ LOG.info(new StringBuffer()
+ .append("Language identifier configuration [")
+ .append(minLength).append("-").append(maxLength)
+ .append("/").append(analyzeLength).append("]").toString());
StringBuffer list = new StringBuffer("Language identifier plugin supports:");
+ HashMap tmpIdx = new HashMap();
while (alllanguages.hasMoreElements()) {
String lang = (String) (alllanguages.nextElement());
InputStream is = this.getClass().getClassLoader().getResourceAsStream(
- "org/apache/nutch/analysis/lang/" + lang + "." + NGramProfile.NGRAM_FILE_EXTENSION);
+ "org/apache/nutch/analysis/lang/" + lang + "." + NGramProfile.FILE_EXTENSION);
if (is != null) {
- NGramProfile profile = new NGramProfile(lang);
+ NGramProfile profile = new NGramProfile(lang, minLength, maxLength);
try {
profile.load(is);
languages.add(profile);
supportedLanguages.add(lang);
- list.append(" " + lang);
+ List ngrams = profile.getSorted();
+ for (int i=0; i 0) && (content.length() > analyzeLength)) {
+ text = new StringBuffer().append(content);
+ text.setLength(analyzeLength);
+ }
- float topscore = Float.MAX_VALUE;
+ suspect.analyze(text);
+
+ Iterator iter = suspect.getSorted().iterator();
+ float topscore = Float.MIN_VALUE;
String lang = "";
-
- Iterator i = languages.iterator();
- while (i.hasNext()) {
-
- NGramProfile profile = (NGramProfile) i.next();
- float score = profile.getSimilarity(p);
-
- //LOG.fine(profile.getName() + ":" + score);
-
- if (score < topscore) {
- topscore = score;
- lang = profile.getName();
- }
+ HashMap scores = new HashMap();
+ NGramEntry searched = null;
+ while (iter.hasNext()) {
+ searched = (NGramEntry) iter.next();
+ NGramEntry[] ngrams = (NGramEntry[]) ngramsIdx.get(searched.getSeq());
+ if (ngrams != null) {
+ for (int j=0; j topscore) {
+ topscore = plScore;
+ lang = profile.getName();
+ }
+ }
+ }
}
-
- p.ngrams.clear();
- p = null;
-
- LOG.finest("TOPSCORE: " + lang + " with " + topscore);
-
- if (topscore > SCORE_THRESOLD)
- return lang;
-
- else return null;
+ return lang;
}
/**
@@ -313,14 +422,17 @@
public String identify(InputStream is) throws IOException {
StringBuffer text = new StringBuffer();
- byte buffer[] = new byte[2000];
+ byte[] buffer = new byte[2048];
int len = 0;
- while ((len = is.read(buffer)) != -1) {
+ while (((len = is.read(buffer)) != -1) &&
+ ((analyzeLength == 0) || (text.length() < analyzeLength))) {
+ if (analyzeLength != 0) {
+ len = Math.min(len, analyzeLength - text.length());
+ }
text.append(new String(buffer, 0, len));
}
-
- return identify(text.toString());
+ return identify(text);
}
public Document filter(Document doc, Parse parse, FetcherOutput fo) throws IndexingException {
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/pt.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/pt.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/pt.ngp (working copy)
@@ -1,1002 +1,3060 @@
-# NgramProfile generated at Sat Sep 25 16:09:24 EEST 2004 for Nutch Language Identification
-ngram_count 19717437
-_ 1162434
-e 845540
-a 761567
-o 715851
-s 579966
-r 462851
-i 425918
-t 353654
-n 349935
-d 343632
-m 299272
-o_ 268946
-u 255448
-s_ 246173
-c 239966
-e_ 215848
-p 206082
-a_ 195759
-l 164207
-de 137262
-es 131745
-os 131004
-en 107456
-nt 102580
-re 96149
-os_ 93319
-te 92571
-co 90242
-as 87677
-v 84865
-er 84358
-do 83545
-ra 81646
-r_ 79835
-m_ 78793
-ta 78318
-da 77840
-ar 77479
-se 76459
-ã 75512
-ão 74666
-q 73498
-qu 73486
-ão_ 73308
-or 70783
-g 68904
-st 64363
-to 64004
-ent 63763
-me 63516
-ad 61653
-em 61407
-f 61098
-ue 59831
-b 59133
-as_ 57798
-que 56968
-is 56123
-ç 54346
-ma 52110
-po 51687
-on 51366
-ro 51161
-ri 50921
-ia 50000
-pr 49913
-am 49614
-ue_ 48092
-nte 47706
-ss 46992
-om 46309
-al 45235
-an 44926
-te_ 43621
-in 43404
-ti 43371
-h 42858
-es_ 40946
-pe 40728
-pa 40327
-ci 40292
-men 38593
-id 38118
-to_ 37902
-no 37170
-ca 36460
-ment 36137
-ec 35784
-est 35703
-mo 35694
-um 35119
-com 34832
-el 34787
-na 34235
-con 33816
-la 32978
-do_ 32874
-it 32740
-tr 32663
-ic 32376
-çã 32297
-ção 32297
-ção_ 32295
-á 30950
-nte_ 30743
-di 30662
-ente 30426
-ve 30124
-é 29556
-ei 29462
-so 29434
-io 29094
-at 28649
-aç 28623
-ia_ 28422
-ar_ 28215
-res 28202
-ra_ 27948
-sta 25994
-dos 25956
-ac 25728
-li 25501
-par 25402
-ir 25288
-ado 25150
-si 24874
-im 24837
-nd 24827
-mi 24457
-Ã 24346
-ns 24184
-ur 23723
-nto 23364
-nc 22974
-l_ 22927
-op 22657
-sa 22345
-or_ 22082
-ce 22045
-z 22005
-er_ 21774
-ma_ 21744
-ai 21534
-ame 21493
-açã 21040
-ação 21040
-ua 20687
-ni 20615
-un 20442
-amen 20307
-ho 20278
-pre 20137
-eu 20117
-pro 19578
-ol 19556
-ida 19525
-de_ 19496
-nto_ 19365
-eg 18843
-is_ 18813
-ara 18619
-ta_ 18436
-ica 18405
-sen 18221
-va 18122
-ap 17975
-nh 17963
-j 17826
-ade 17583
-od 17470
-vi 17433
-da_ 17399
-em_ 17363
-por 17260
-iv 17248
-le 17195
-mos 16899
-ter 16877
-tu 16648
-dad 16600
-cia 16511
-mos_ 16486
-uma 16455
-ess 16398
-mp 16314
-tra 16270
-u_ 16032
-des 15995
-rt 15905
-ento 15884
-ui 15739
-x 15642
-ria 15577
-dos_ 15559
-õ 15481
-õe 15481
-oc 15369
-ct 15206
-lo 15204
-ut 15186
-al_ 15109
-esta 15079
-fi 14967
-ões 14808
-ões_ 14804
-vo 14560
-ne 14535
-para 14512
-ed 14430
-nta 14430
-gu 14398
-das 14350
-ais 14232
-sã 14223
-são 14212
-io_ 14192
-ara_ 14096
-ant 14084
-ais_ 13932
-ó 13921
-dade 13850
-sp 13695
-rm 13687
-iss 13625
-nã 13463
-não 13461
-rop 13397
-ont 13118
-ada 13101
-nos 13062
-fo 12962
-tiv 12897
-ito 12896
-ou 12834
-ado_ 12826
-tad 12776
-mb 12726
-ob 12655
-su 12486
-ons 12392
-ela 12344
-ev 12272
-idad 12261
-nci 12089
-go 12047
-br 12025
-á_ 11999
-ste 11923
-rio 11757
-enh 11729
-ga 11622
-ab 11599
-fe 11593
-so_ 11493
-tar 11461
-são_ 11402
-ex 11260
-tos 11247
-tos_ 11196
-uro 11192
-ep 11176
-pres 11143
-lh 11133
-hor 11035
-pos 11024
-ao 10956
-gr 10881
-ade_ 10870
-nho 10866
-mo_ 10860
-cons 10805
-mu 10741
-omi 10690
-sso 10690
-Ã 10530
-ea 10425
-il 10407
-ria_ 10401
-çõ 10399
-çõe 10399
-ções 10399
-ul 10354
-ist 10262
-era 10249
-mis 10234
-cu 10231
-ro_ 10200
-am_ 10193
-eur 10153
-rec 10096
-euro 10095
-enta 10062
-om_ 10046
-miss 9950
-ef 9949
-fa 9941
-enho 9842
-ser 9818
-cont 9794
-ba 9780
-ca_ 9780
-sta_ 9772
-tam 9767
-per 9754
-tado 9752
-ect 9564
-ver 9488
-for 9481
-et 9459
-ig 9421
-ntr 9414
-ados 9362
-omis 9362
-ncia 9355
-ê 9331
-nhor 9305
-ha 9284
-urop 9263
-tem 9248
-senh 9241
-eit 9235
-comi 9231
-qua 9034
-iz 9024
-ese 9002
-ime 8935
-us 8925
-esp 8865
-ran 8858
-sid 8855
-ope 8832
-ora 8729
-ár 8729
-ito_ 8662
-mas 8639
-ov 8628
-tic 8563
-gi 8494
-i_ 8465
-ide 8439
-tes 8388
-aco 8387
-ssã 8355
-ssão 8355
-re_ 8323
-este 8294
-oss 8245
-emo 8239
-ido 8211
-uni 8210
-int 8208
-iva 8175
-ssa 8166
-ári 8155
-ndo 8121
-ica_ 8112
-das_ 8059
-cr 7981
-ça 7959
-ece 7951
-rd 7947
-sse 7914
-av 7899
-oi 7882
-tes_ 7877
-lt 7864
-ura 7784
-rel 7763
-omo 7758
-ass 7728
-ali 7727
-rá 7721
-au 7711
-ante 7703
-ada_ 7700
-mai 7648
-rio_ 7627
-ere 7561
-ram 7548
-bi 7532
-ita 7497
-ost 7491
-lu 7487
-den 7473
-rela 7428
-eri 7374
-sa_ 7367
-der 7355
-ot 7330
-cia_ 7312
-ndo_ 7311
-ten 7311
-spe 7290
-ste_ 7265
-rope 7260
-be 7176
-issã 7158
-ag 7141
-egu 7132
-ém 7120
-ros 7115
-inte 7105
-iç 7097
-pel 7067
-ir_ 7020
-sso_ 7018
-hor_ 7017
-tiva 7003
-gra 6993
-lat 6985
-pl 6972
-za 6962
-fic 6878
-nç 6863
-sc 6859
-orm 6832
-ode 6829
-eir 6828
-ore 6785
-are 6776
-cio 6770
-ort 6754
-ge 6740
-lo_ 6716
-tar_ 6685
-eve 6683
-str 6660
-ati 6639
-tan 6635
-rma 6598
-que_ 6576
-sti 6573
-amb 6510
-ém_ 6467
-ina 6456
-pri 6443
-nde 6440
-res_ 6436
-emos 6418
-side 6397
-dent 6382
-se_ 6351
-omo_ 6346
-como 6342
-eci 6336
-apr 6304
-du 6298
-eu_ 6288
-açõ 6287
-açõe 6287
-ên 6286
-reg 6226
-esen 6188
-ros_ 6186
-dir 6158
-cto 6140
-ênc 6128
-ênci 6127
-ie 6123
-obr 6113
-rc 6113
-art 6094
-pei 6087
-rr 6066
-lho 6046
-mais 6026
-end 6024
-ú 6004
-raç 5997
-and 5978
-if 5959
-elat 5954
-ico 5954
-ome 5950
-ona 5947
-eco 5940
-eito 5898
-osta 5885
-vel 5857
-pu 5851
-imen 5833
-tant 5812
-rg 5799
-he 5781
-tas 5765
-va_ 5763
-rn 5742
-iza 5727
-seg 5718
-el_ 5713
-lam 5713
-tá 5697
-ion 5694
-emp 5692
-esi 5692
-segu 5681
-ual 5667
-ire 5664
-port 5652
-ntes 5642
-tur 5635
-dev 5609
-tas_ 5608
-form 5598
-co_ 5589
-ho_ 5572
-imp 5569
-az 5566
-nv 5564
-tro 5561
-lar 5555
-amo 5554
-ze 5523
-ru 5521
-iden 5500
-nter 5479
-tica 5471
-bre 5445
-cor 5371
-ano 5367
-eia 5360
-orma 5360
-ário 5360
-dep 5357
-ido_ 5345
-ili 5321
-lame 5304
-espe 5293
-ces 5290
-ios 5277
-cas 5276
-tor 5273
-ju 5242
-ias 5222
-iã 5217
-ião 5200
-ião_ 5200
-nti 5178
-ud 5178
-cti 5166
-pen 5166
-sent 5164
-ias_ 5162
-tod 5161
-act 5155
-uta 5153
-cl 5143
-pod 5129
-ib 5126
-iona 5100
-ele 5093
-dire 5079
-lid 5078
-resi 5078
-cess 5071
-ontr 5046
-rta 5033
-fer 5032
-nda 5019
-sob 5018
-pode 5011
-esid 5009
-nse 5009
-amos 5000
-aq 4996
-aqu 4993
-ctiv 4989
-obre 4978
-ici 4964
-ema 4953
-Ãt 4951
-rem 4950
-nst 4946
-fu 4927
-vel_ 4903
-eq 4884
-equ 4883
-ind 4883
-lida 4881
-odo 4880
-là 4851
-bé 4848
-itu 4841
-min 4839
-mpo 4831
-rei 4827
-efe 4824
-ativ 4800
-mpr 4796
-ios_ 4774
-ref 4772
-pol 4761
-ses 4755
-ores 4754
-Ãti 4736
-uit 4734
-car 4717
-esse 4716
-tamb 4716
-ambé 4713
-bém 4713
-bém_ 4713
-mbé 4713
-mbém 4713
-eia_ 4712
-cion 4699
-dem 4679
-af 4669
-rat 4667
-und 4666
-onse 4652
-z_ 4652
-ssi 4650
-tã 4647
-rad 4634
-tão 4628
-nu 4622
-cer 4612
-deve 4610
-ora_ 4605
-edi 4592
-man 4585
-ivo 4584
-dis 4581
-sobr 4579
-ens 4561
-post 4557
-sto 4547
-ord 4540
-lic 4534
-rá_ 4530
-qui 4525
-nha 4521
-resp 4512
-opo 4511
-no_ 4509
-bo 4507
-nf 4504
-nal 4500
-spo 4493
-ou_ 4487
-ae 4473
-og 4473
-nos_ 4451
-niã 4449
-nião 4449
-vo_ 4449
-ira 4439
-emb 4419
-cad 4410
-eo 4408
-elo 4406
-ór 4401
-je 4386
-ori 4380
-elh 4369
-part 4359
-aci 4353
-oa 4352
-mui 4351
-muit 4351
-ecti 4337
-ate 4336
-tal 4329
-fica 4327
-pon 4322
-ari 4317
-nas 4289
-tivo 4286
-lm 4280
-inc 4271
-sem 4269
-Ãtic 4265
-ssa_ 4264
-ses_ 4233
-ial 4227
-lho_ 4213
-ja 4209
-ez 4193
-rl 4186
-ej 4178
-vid 4158
-ram_ 4145
-xi 4145
-sm 4140
-olà 4135
-sá 4127
-ras 4118
-lme 4106
-opei 4105
-polà 4105
-go_ 4096
-put 4093
-peia 4092
-lmen 4083
-tó 4082
-raçã 4073
-utad 4073
-epu 4071
-col 4070
-bl 4065
-té 4063
-puta 4061
-iva_ 4048
-liz 4048
-óri 4048
-lÃt 4036
-lÃti 4036
-olÃt 4030
-rla 4024
-tão_ 4010
-eput 4009
-elho 4005
-rese 4003
-aa 3996
-depu 3992
-stad 3991
-ern 3983
-Ãv 3982
-nes 3975
-rar 3975
-sse_ 3970
-pi 3965
-erc 3961
-ede 3955
-ata 3951
-up 3948
-mas_ 3944
-la_ 3934
-Ãs 3934
-uer 3926
-omp 3920
-erm 3911
-bre_ 3906
-tór 3905
-tóri 3905
-ula 3903
-prop 3891
-cid 3889
-anto 3887
-nça 3850
-egi 3849
-esso 3836
-arl 3827
-comp 3827
-entr 3825
-aà 3822
-rte 3813
-arla 3797
-rlam 3796
-parl 3795
-um_ 3786
-Ãve 3780
-noss 3777
-pelo 3776
-star 3774
-uniã 3763
-adas 3760
-ça_ 3758
-nic 3743
-ini 3739
-des_ 3735
-opa 3729
-uito 3728
-ér 3719
-dese 3707
-iro 3702
-tura 3697
-oci 3695
-ase 3675
-lv 3673
-alm 3672
-anç 3671
-itos 3670
-omu 3657
-mun 3641
-tri 3619
-acom 3612
-ntra 3611
-ch 3602
-onc 3592
-ço 3585
-stã 3582
-cto_ 3576
-tua 3575
-stão 3571
-alme 3570
-conc 3567
-rs 3558
-ras_ 3557
-quer 3550
-sua 3550
-ifi 3546
-ien 3537
-essa 3534
-fr 3534
-enc 3532
-ades 3528
-ntos 3515
-ena 3509
-mpre 3507
-rti 3507
-comu 3503
-cial 3501
-ng 3494
-sas 3494
-vol 3493
-taç 3492
-sár 3491
-sári 3491
-ico_ 3481
-mer 3480
-liza 3471
-dest 3469
-poss 3468
-eraç 3467
-econ 3466
-estã 3466
-ua_ 3466
-pec 3465
-eiro 3455
-rv 3455
-ssá 3451
-isso 3447
-ific 3440
-ndi 3437
-ssár 3431
-uç 3431
-ient 3424
-ecto 3421
-fun 3410
-alt 3409
-â 3407
-apo 3403
-fin 3402
-tid 3383
-ain 3382
-cul 3370
-ório 3370
-sas_ 3360
-ues 3348
-sos 3346
-bil 3339
-sos_ 3338
-aÃs 3330
-cri 3328
-orta 3328
-gar 3326
-ança 3317
-paà 3314
-paÃs 3314
-anos 3312
-trat 3312
-ama 3308
-poi 3308
-aba 3302
-ató 3296
-dec 3290
-ida_ 3288
-mes 3286
-spec 3286
-gos 3283
-uan 3283
-gun 3280
-ropo 3278
-ape 3277
-rar_ 3273
-bal 3265
-leg 3264
-tre 3263
-mem 3262
-esa 3255
-içã 3251
-ição 3251
-reit 3250
-ins 3248
-atór 3247
-arti 3246
-impo 3245
-roc 3227
-erá 3226
-ial_ 3226
-ntar 3224
-dam 3223
-zer 3223
-lg 3212
-ret 3210
-aria 3208
-todo 3201
-eira 3200
-ren 3200
-rda 3199
-of 3197
-quan 3194
-esc 3191
-bili 3190
-irei 3189
-unt 3179
-out 3175
-ega 3170
-mbr 3156
-sol 3149
-elo_ 3148
-ando 3136
-laç 3132
-tit 3128
-na_ 3123
-erv 3120
-utr 3120
-embr 3103
-did 3098
-eme 3098
-mpl 3090
-mei 3086
-stas 3074
-nce 3072
-ques 3068
-bro 3067
-outr 3066
-lem 3064
-ral 3061
-ven 3058
-Ãvel 3058
-nco 3055
-nsi 3054
-qual 3050
-rim 3049
-dor 3046
-sej 3045
-eja 3036
-cos 3034
-peu 3033
-uçã 3029
-ução 3029
-opeu 3028
-ond 3021
-cei 3020
-seu 3017
-aos 3016
-ossa 3013
-ha_ 3005
-nal_ 3003
-ose 3002
-smo 2996
-ve_ 2988
-cis 2987
-rea 2986
-uma_ 2984
-mpor 2982
-Ã s 2980
-ee 2976
-uest 2968
-zer_ 2956
-erá_ 2952
-nec 2951
-apre 2943
-po_ 2939
-vis 2935
-sit 2932
-uto 2924
-ult 2922
-env 2919
-ete 2916
-ero 2915
-mbro 2915
-proc 2914
-nece 2899
-iste 2898
-nda_ 2893
-rmo 2885
-tin 2885
-enç 2883
-mit 2881
-ior 2880
-olv 2880
-eno 2873
-titu 2868
-apro 2865
-áv 2862
-dia 2860
-soc 2859
-nest 2858
-ala 2842
-rç 2842
-soci 2840
-cas_ 2836
-dame 2828
-sel 2825
-lató 2821
-ova 2820
-cos_ 2817
-vam 2817
-rà 2815
-eda 2812
-evi 2811
-ivo_ 2810
-ista 2806
-até 2804
-hora 2790
-opos 2786
+# NgramProfile generated at Tue May 31 02:45:57 CEST 2005 for Nutch Language Identification
+e 17919538
+a 16031888
+o 14754146
+s 12101440
+r 9718552
+i 8913497
+n 7501577
+t 7371138
+d 7233459
+m 6272995
+u 5307741
+c 4984061
+p 4683707
+l 3527564
+v 1732859
+g 1532209
+ã 1520772
+q 1441824
+f 1251635
+b 1241867
+ç 1114513
+h 917591
+é 622776
+á 618204
+à495106
+z 459931
+j 372259
+x 324953
+õ 315580
+ó 285345
+à212341
+ê 202916
+k 138710
+ú 130518
+â 71254
+y 28058
+º 24622
+w 20704
+ô 11003
+ö 5969
+è 5289
+ü 2019
+ä 1907
+ª 678
+æ 643
+ò 416
+ñ 379
+î 339
+û 322
+ï 266
+ù 263
+ß 225
+ø 223
+Ã¥ 129
+ë 49
+ì 33
+µ 3
+ý 3
+ð 2
+o_ 6117980
+e_ 5298721
+s_ 5100395
+a_ 5065192
+_d 3720361
+_a 3044736
+_p 2871315
+de 2856114
+es 2716048
+_e 2644534
+os 2570809
+en 2214616
+nt 2118519
+_c 2036453
+re 2001860
+te 1914497
+co 1884460
+_s 1831747
+er 1811461
+do 1747296
+r_ 1743612
+as 1728522
+ra 1699164
+m_ 1616969
+se 1589599
+ta 1589161
+da 1582027
+ar 1556505
+ão 1504816
+_n 1460544
+qu 1440538
+or 1421425
+me 1392751
+_o 1380812
+to 1321467
+st 1319044
+em 1251610
+ue 1214092
+_q 1199211
+ad 1193217
+is 1156670
+on 1084606
+ro 1080308
+_m 1080243
+ma 1077106
+po 1062570
+pr 1054935
+am 1047995
+ri 1037277
+ia 1025024
+_t 970513
+ss 969444
+an 954555
+pe 943223
+om 917265
+ti 916200
+al 916164
+in 900485
+id 897982
+_r 868238
+pa 857422
+ci 827696
+_i 806619
+na 793628
+la 753541
+el 744099
+no 741933
+ca 734102
+mo 732722
+um 708851
+_u 697400
+ec 681951
+tr 680137
+it 677754
+_f 672120
+ic 668448
+çã 653915
+ve 624557
+di 618838
+so 613063
+io 609991
+ei 585276
+aç 579484
+at 562197
+si 559692
+nd 528923
+ns 525908
+im 517858
+li 517456
+ir 516214
+mi 505431
+ur 499708
+l_ 497171
+nc 468506
+ua 467725
+ce 466916
+sa 459975
+ni 451516
+un 427682
+eu 425915
+ho 425542
+_l 415549
+ai 402044
+ac 400052
+_v 390026
+le 386851
+ol 386139
+op 385835
+eg 373681
+sp 370517
+va 368054
+nh 367285
+u_ 346958
+mp 345509
+vi 345184
+iv 342287
+gu 339817
+tu 339408
+rt 337841
+ut 326878
+ui 321053
+õe 315573
+ne 314539
+od 311627
+fi 307128
+ct 306758
+lo 304098
+vo 294276
+é_ 293937
+rm 283486
+sã 283063
+ou 280559
+su 271708
+ap 270987
+nã 269328
+_g 267559
+br 267371
+p_ 266947
+ob 265315
+fo 264782
+_é 264734
+mb 256077
+ga 252603
+oc 247150
+lh 246476
+á_ 244428
+ev 243522
+go 239882
+ex 235355
+fe 232241
+ab 230042
+gr 227503
+mu 227224
+il 221107
+ul 220212
+_b 216779
+cu 214671
+_à211501
+çõ 211323
+ba 206413
+fa 203636
+ag 202695
+ha 201380
+ao 200372
+ea 198525
+us 197604
+ig 195788
+ge 193379
+ed 190816
+ef 189928
+i_ 188682
+_h 185169
+iz 184570
+et 178582
+ep 176787
+cr 174092
+rd 171332
+ár 171325
+ça 170424
+lt 170122
+ov 168510
+gi 167036
+à_ 164129
+oi 162768
+rá 161144
+lu 156194
+be 152469
+av 145623
+sc 145341
+iç 145232
+nç 145194
+pl 142737
+bi 139423
+_j 139354
+za 138569
+du 136590
+ên 136065
+ng 134441
+ém 131445
+rc 130886
+ie 129410
+ot 126773
+he 125171
+pu 124378
+rr 124170
+rg 122470
+if 119599
+d_ 116756
+tá 116588
+rn 115397
+az 114056
+nv 112659
+ru 112207
+ze 110603
+cl 109348
+z_ 108785
+ju 108234
+iã 105972
+ÃÂt 104937
+au 104103
+ud 103859
+ib 103471
+là101362
+nu 100464
+n_ 100177
+ór 99552
+ke 96360
+ak 95424
+bé 95181
+fu 94646
+rl 94367
+tó 93357
+bo 93169
+nf 93033
+bl 92836
+ez 91918
+tã 91199
+je 89901
+lm 89647
+té 87124
+ja 86303
+xi 84842
+ch 84270
+ej 82453
+sm 81957
+ÃÂs 81759
+og 81604
+up 81603
+ÃÂv 81088
+sá 81053
+aà79829
+fr 78426
+pi 76336
+ço 76227
+uç 72725
+ér 72301
+lv 72245
+rv 68107
+rç 65602
+eq 64180
+lg 63503
+rs 63237
+t_ 61245
+bu 60326
+aq 59622
+rà57845
+áv 57707
+ip 56958
+nó 56271
+eb 55137
+uc 53449
+xe 52865
+já 50234
+cç 50230
+ub 49666
+ug 49589
+oa 49368
+bs 49276
+ÃÂc 48573
+ân 48107
+xt 47382
+às 46240
+rê 45493
+ró 45309
+sà44336
+af 44092
+há 43158
+cà42186
+oj 41900
+tê 41695
+xp 40816
+ÃÂn 40223
+_ú 39048
+xa 38371
+nà37833
+sf 37570
+ÃÂd 37363
+ós 37300
+bj 36906
+rã 36865
+of 36838
+rq 36123
+zi 34498
+hu 34379
+uz 33678
+eç 33481
+pt 33337
+ix 33098
+mé 32830
+dr 32696
+dã 32583
+sõ 32555
+át 32294
+oo 32264
+eo 32163
+óm 32118
+aj 31754
+fl 31428
+só 30635
+jo 30030
+sl 29985
+gn 29843
+mà28884
+dê 28627
+hi 28255
+zo 28083
+iá 27510
+és 26964
+uà26744
+úb 26713
+pú 26633
+ó_ 26606
+tâ 26547
+óp 26303
+vr 26025
+oe 25271
+_á 25244
+ré 24811
+tà24439
+xc 23742
+iu 23364
+ee 23235
+êm 23233
+úl 23123
+º_ 22964
+âm 22857
+éc 22559
+ál 22271
+lq 22119
+nq 21653
+ld 21435
+lé 21222
+ná 21112
+ÃÂp 20539
+ll 20274
+ás 20169
+c_ 19974
+vé 19874
+ês 19629
+uv 18734
+tõ 18550
+má 18476
+nj 18426
+úd 18421
+g_ 17891
+vá 17832
+iõ 17666
+_k 17248
+dú 17173
+ám 17170
+uê 17158
+nú 17097
+ét 16956
+cn 16856
+xo 16725
+ún 16095
+gl 15907
+gê 15674
+ác 15563
+sé 15502
+úm 15426
+_â 15265
+lc 15133
+ÃÂa 14878
+h_ 14691
+fà14671
+ÃÂf 14618
+iê 14523
+óx 14382
+nn 14326
+pó 14248
+ús 14239
+uo 14203
+aú 14063
+ê_ 14023
+b_ 13932
+éd 13805
+uf 13608
+hõ 13569
+ux 13475
+dm 13471
+zã 13396
+pç 13338
+sd 13181
+y_ 12998
+ég 12995
+põ 12862
+nº 12743
+_z 12733
+sq 12594
+ón 12588
+iq 12475
+ló 12366
+_º 11869
+ã_ 11857
+tt 11830
+cá 11822
+ué 11696
+dá 11482
+ls 11478
+rb 11259
+_w 11213
+rp 11098
+uj 10822
+k_ 10625
+pp 10526
+ae 10513
+óg 10160
+lá 10110
+ÃÂo 10091
+th 10078
+hã 9632
+én 9592
+rf 9374
+ág 9346
+áf 9215
+dé 9208
+ts 9105
+pô 9085
+gé 9082
+và8928
+nl 8747
+ko 8595
+bt 8488
+râ 8395
+pé 8383
+vê 8334
+ÃÂ_ 8324
+zm 8170
+úv 8124
+_ó 7798
+ÃÂr 7794
+x_ 7565
+ka 7548
+mã 7547
+lê 7503
+ól 7172
+oz 7162
+né 7060
+oç 7025
+bv 6998
+ox 6965
+ÃÂl 6904
+ij 6882
+sb 6875
+ax 6855
+ck 6826
+sv 6795
+v_ 6656
+ÃÂb 6520
+sr 6475
+dà6439
+zõ 6333
+ps 6306
+ki 6275
+mm 6121
+_ê 6020
+mc 5968
+ôr 5952
+lâ 5834
+vã 5774
+pà5700
+câ 5640
+út 5637
+nz 5595
+f_ 5519
+él 5476
+cc 5381
+wa 5272
+có 5230
+rú 5082
+êx 4978
+sh 4964
+mó 4944
+ey 4877
+eú 4644
+cê 4630
+ii 4550
+oq 4439
+áx 4382
+aa 4367
+áu 4356
+ÃÂm 4313
+fé 4302
+xà4276
+óc 4268
+lp 4254
+áp 4125
+tl 4018
+fá 4003
+hr 4002
+nr 3959
+zê 3947
+gá 3917
+bá 3743
+wi 3709
+mê 3691
+gà3645
+hl 3632
+ée 3566
+gm 3518
+ay 3470
+aé 3463
+sn 3438
+lb 3435
+ód 3385
+ow 3333
+tc 3304
+ff 3276
+eà3250
+vu 3246
+dt 3228
+ót 3205
+ik 3187
+ah 3146
+éf 3120
+bm 3045
+sê 2997
+gã 2995
+we 2983
+_x 2978
+óv 2889
+ãs 2864
+dó 2858
+nâ 2844
+dv 2839
+gó 2770
+év 2740
+tn 2708
+ób 2708
+sk 2707
+oá 2687
+wo 2682
+ÃÂg 2681
+hn 2660
+mú 2622
+cé 2612
+ÃÂz 2595
+pc 2578
+cp 2569
+ye 2560
+fó 2538
+ph 2527
+dq 2517
+_à2504
+zá 2501
+xã 2440
+lf 2436
+oh 2420
+ly 2418
+ôs 2328
+ry 2311
+ép 2293
+nk 2288
+ht 2286
+rk 2281
+ek 2247
+pá 2234
+hm 2226
+xu 2187
+pm 2161
+hé 2153
+tm 2099
+áb 2086
+oy 2063
+ys 2057
+tz 2055
+dd 2025
+èr 2019
+cã 2008
+ok 2002
+bc 1978
+yn 1952
+àq 1942
+gh 1907
+ié 1889
+êe 1862
+bó 1831
+rh 1816
+eh 1800
+j_ 1772
+iè 1771
+sg 1749
+mn 1707
+ya 1657
+rz 1655
+_y 1640
+ms 1586
+zz 1569
+ºs 1568
+rö 1559
+ft 1512
+ió 1502
+yr 1501
+êu 1493
+ói 1477
+uá 1459
+ew 1452
+êt 1417
+lz 1414
+vó 1387
+nê 1382
+nb 1361
+w_ 1360
+kl 1358
+áq 1339
+by 1335
+lk 1298
+ör 1295
+kh 1287
+rè 1278
+ès 1264
+rõ 1263
+kr 1220
+ln 1216
+ãe 1212
+án 1208
+lç 1199
+dâ 1191
+ds 1179
+ks 1159
+dg 1153
+yl 1133
+hy 1119
+xé 1104
+ös 1103
+dj 1097
+ád 1095
+my 1092
+pã 1085
+cm 1080
+sy 1080
+óf 1075
+gg 1074
+sw 1069
+vâ 1057
+ji 1038
+bâ 1033
+mâ 1017
+tú 1017
+úc 1016
+ws 1015
+éi 1000
+öm 993
+xx 986
+çá 983
+ty 975
+än 963
+yo 962
+dy 947
+bb 925
+jö 915
+zu 915
+_ã 910
+bö 897
+cq 893
+sj 878
+oà873
+ôm 868
+eó 861
+wu 855
+èm 852
+uy 850
+lè 846
+rü 842
+úr 838
+cd 837
+bd 830
+ny 828
+db 812
+éu 812
+ÃÂq 811
+bà786
+éb 767
+yt 763
+js 759
+uq 758
+ÃÂç 757
+lô 737
+üb 736
+ml 734
+gd 732
+qv 724
+ky 720
+wh 720
+gt 715
+lã 702
+cú 699
+pê 698
+dz 694
+xõ 692
+uh 682
+jk 679
+ª_ 675
+nm 659
+rj 658
+yi 653
+çu 652
+jt 646
+_ª 629
+ku 624
+éa 624
+uk 623
+fs 618
+ôd 605
+wy 604
+pn 585
+tw 579
+aw 573
+dh 568
+zq 562
+gâ 554
+éx 554
+wl 544
+ih 533
+hó 512
+py 511
+dn 510
+èg 505
+km 503
+öd 494
+pâ 487
+fm 485
+pä 483
+üh 467
+uâ 463
+hö 454
+çú 454
+ön 453
+vc 435
+xá 435
+cs 433
+wm 433
+cy 430
+úp 415
+nx 413
+nw 412
+bã 410
+fâ 409
+pv 403
+éo 399
+hà398
+kn 392
+bæ 391
+ôl 391
+æk 388
+mü 385
+ül 385
+uã 382
+hw 381
+bh 378
+oó 378
+dü 375
+éq 373
+hä 372
+bn 370
+fú 369
+hú 369
+çe 369
+éj 369
+cô 364
+eá 357
+jn 350
+df 348
+dw 346
+zn 346
+sö 342
+lú 341
+vs 332
+ym 330
+kj 325
+dl 322
+gy 322
+öl 316
+gs 315
+kk 315
+yb 309
+iö 304
+rô 300
+q_ 298
+aî 295
+jà295
+är 294
+ôn 293
+là292
+ô_ 290
+bê 289
+kx 288
+uu 283
+úg 281
+dö 280
+_ö 275
+fä 272
+tè 271
+mt 269
+iw 267
+öh 267
+uw 266
+mf 262
+ù_ 259
+sò 258
+où 257
+gú 256
+òl 256
+bk 254
+ÃÂe 253
+rw 248
+äm 244
+jã 239
+ög 239
+tb 238
+dc 237
+kä 236
+cf 235
+tp 229
+ær 228
+kt 225
+jæ 224
+lö 224
+pk 223
+eâ 221
+zh 215
+öw 215
+öö 215
+fê 213
+vd 211
+lõ 210
+bp 207
+lä 205
+ît 204
+zé 202
+añ 200
+ût 196
+ün 196
+fô 195
+mh 187
+oé 186
+bú 185
+ør 184
+dk 183
+cè 182
+kf 181
+öc 180
+oû 179
+sú 179
+gü 178
+zs 178
+mr 177
+dè 173
+fn 171
+zà171
+ôt 171
+fc 169
+ß_ 169
+hd 168
+kv 168
+zf 168
+hh 167
+yp 167
+mg 166
+yu 166
+tf 165
+gö 164
+np 160
+pö 160
+wn 160
+eõ 158
+iú 157
+fã 155
+qa 155
+èt 155
+aß 154
+vl 154
+yk 153
+ò_ 153
+cò 151
+jø 151
+xv 151
+jm 150
+tx 150
+pè 147
+zl 146
+yd 144
+ño 143
+yh 142
+dõ 141
+gp 141
+ñe 139
+wt 136
+gb 135
+hj 134
+hè 133
+fy 130
+tv 130
+sç 129
+óq 129
+pd 128
+ï_ 128
+âc 125
+èd 124
+zâ 122
+iâ 121
+mè 121
+hk 118
+xó 118
+aó 117
+uó 117
+în 117
+cb 115
+êc 115
+jú 114
+eã 113
+cv 112
+nè 111
+èn 110
+pf 108
+yc 107
+yy 106
+aï 105
+iñ 105
+md 105
+zó 105
+nä 104
+tà103
+tô 102
+zb 99
+td 98
+kg 97
+äf 97
+pg 95
+vä 93
+úz 92
+bw 91
+mõ 91
+tj 91
+ö_ 91
+hs 90
+nö 86
+rà85
+äy 85
+_ç 84
+èv 84
+vm 83
+wr 83
+ür 82
+iy 81
+äl 81
+fp 80
+tk 80
+lr 78
+rx 77
+cg 76
+èl 76
+hb 75
+hô 75
+zr 75
+üs 75
+xf 74
+sä 73
+hc 72
+ä_ 71
+gc 70
+pj 69
+dp 68
+ât 68
+çi 66
+_Ã¥ 65
+ûr 65
+hü 64
+ña 64
+sû 63
+áô 63
+ÃÂá 62
+ôï 62
+cõ 58
+hp 57
+gè 55
+tg 55
+yé 55
+dû 54
+os_ 2142135
+_de 1975311
+de_ 1617478
+ão_ 1478264
+_co 1464353
+as_ 1411229
+ent 1325263
+_qu 1198988
+que 1149459
+_a_ 1135607
+do_ 1062573
+_se 1006738
+ue_ 986843
+nte 978732
+te_ 892542
+es_ 872000
+_pr 795467
+men 784189
+to_ 778493
+da_ 773838
+_re 753338
+est 727728
+com 721755
+con 711827
+em_ 688071
+_do 681699
+_pa 673543
+_e_ 671920
+_o_ 667318
+_es 662027
+_po 657466
+ção 653869
+_da 641342
+res 607492
+ia_ 583430
+ar_ 581729
+ra_ 576172
+er_ 538830
+par 534052
+dos 526120
+sta 522015
+ado 519099
+_um 513162
+_no 511235
+ame 510823
+nto 479441
+or_ 446062
+ma_ 441467
+pre 436309
+se_ 425973
+açã 424683
+_em 415979
+pro 408225
+_in 399776
+ida 390795
+is_ 385607
+ara 381400
+_pe 377719
+ica 372078
+sen 369260
+ta_ 367610
+ter 359209
+_as 358641
+_ma 355590
+_na 353398
+por 351568
+_di 345891
+cia 343427
+tra 341742
+_me 341026
+mos 335242
+uma 332761
+ess 329939
+dad 329662
+des 326463
+ade 320870
+_te 313565
+no_ 313358
+al_ 313016
+ria 307330
+ões 302737
+das 299343
+io_ 294175
+_os 292326
+um_ 291011
+nta 285761
+ant 285368
+ais 284992
+são 282800
+rop 281463
+iss 276210
+ont 274984
+ons 273218
+tad 269950
+não 269324
+_nã 268090
+_p_ 261045
+ela 258453
+ada 257058
+ito 256632
+_é_ 256074
+tiv 252434
+nos 251191
+nci 245619
+ste 242734
+rio 242486
+spe 240718
+enh 238275
+uro 236028
+so_ 232809
+pos 232060
+_eu 229506
+tos 229064
+na_ 228804
+tar 228435
+sso 226369
+mo_ 225147
+hor 223724
+nho 219397
+ist 216293
+om_ 214485
+eur 213785
+era 213543
+ro_ 212548
+_so 211361
+çõe 211320
+sid 210862
+am_ 210723
+_en 210320
+omi 208137
+_tr 207640
+_ap 204614
+mis 204476
+ca_ 204294
+_ac 204288
+ser 202377
+rec 201236
+_al 199268
+per 197901
+ntr 197659
+_ao 197149
+re_ 196090
+_ex 195996
+ide 194914
+ver 194325
+tam 192633
+for 192407
+ran 189294
+tic 187888
+ect 186459
+tem 185255
+_ne 181517
+esp 181068
+_fo 180552
+_fa 180475
+_ca 180076
+me_ 179756
+ope 179496
+_su 179266
+eit 178853
+ora 178358
+den 176721
+ime 176491
+uni 176057
+tes 175313
+mas 174931
+qua 174222
+ido 171635
+rel 168831
+oss 168541
+ndo 167494
+ass 167042
+ese 166363
+ssã 166089
+_ta 164957
+_to 163742
+_à_ 163383
+ece 162527
+ssa 162206
+int 162181
+emo 161430
+ári 160877
+mai 160824
+sse 160575
+iva 160143
+ura 159266
+ou_ 155423
+ita 155062
+omo 154907
+ram 152948
+ost 152899
+ten 152869
+eu_ 151550
+ir_ 150552
+ros 150529
+ali 147439
+eri 147305
+egu 147225
+lat 147060
+lo_ 146106
+ort 145756
+der 145497
+pel 145381
+sa_ 145360
+sti 143808
+lho 141863
+ere 141559
+gra 141447
+fic 141439
+eir 141237
+esi 140556
+cio 140155
+ao_ 139902
+_mu 138805
+ati 137780
+rma 136498
+tan 136496
+obr 136321
+orm 135547
+ina 135132
+str 134549
+and 133642
+eve 133371
+nde 133123
+ênc 132515
+_si 132430
+eci 132223
+pri 131346
+ho_ 129898
+açõ 129494
+_ou 129150
+ion 128226
+_ve 128021
+ém_ 127796
+end 127482
+cto 126021
+raç 125570
+bre 125027
+pei 124607
+art 124519
+ico 124081
+el_ 123523
+_im 122944
+amb 122571
+seg 121657
+ona 121416
+lam 120283
+tas 120157
+vel 119575
+emp 119447
+imp 119101
+nse 118527
+co_ 117043
+nam 116539
+lar 116127
+reg 115953
+_mo 115841
+_un 115792
+iza 115419
+ode 114986
+sob 114486
+tro 114256
+cor 114051
+_id 113920
+_an 113590
+tur 113467
+dev 113455
+dep 113146
+_vi 113028
+tor 112862
+dir 112527
+ual 112223
+va_ 111769
+ces 111581
+_fi 111540
+act 110631
+eia 110532
+uta 110144
+_la 108776
+cas 108717
+nti 107168
+nda 106692
+ind 106425
+ias 106210
+pen 106180
+pod 106100
+ião 105666
+ssi 105082
+ire 104981
+ili 104715
+ele 104436
+tod 103954
+amo 103892
+mpo 103859
+ios 103754
+ici 103171
+min 103053
+ore 102800
+elh 102268
+ens 101637
+rem 101606
+cti 101491
+mpr 101375
+rta 101187
+nst 99847
+ome 99822
+ÃÂti 99575
+rat 99361
+cer 98962
+pol 98788
+itu 98718
+dem 98300
+ord 98233
+ses 97498
+emb 97441
+lid 97342
+odo 97086
+fer 96972
+efe 96724
+la_ 96699
+rad 96628
+man 96603
+uit 96583
+id_ 96353
+nha 95728
+nal 95103
+rá_ 94566
+ema 94194
+dis 93856
+lic 93818
+sto 93492
+age 93359
+_gr 92773
+_cr 92310
+mbé 92099
+bém 92086
+óri 92050
+niã 92026
+ref 92000
+ker 91849
+edi 91768
+_sp 91739
+opo 91681
+und 91586
+lan 91376
+ira 91295
+_or 91164
+gua 90957
+are 90859
+tão 90837
+ake 90782
+sem 90782
+pea 90711
+mui 90527
+spo 90369
+eak 90346
+ori 90180
+qui 90149
+elo 89617
+tór 89348
+rla 88743
+eco 88582
+ivo 88554
+car 88509
+aci 88324
+_sa 87828
+rei 87581
+ial 87491
+tal 87288
+olà87116
+_mi 86158
+_at 85914
+put 85860
+ano 85092
+go_ 85039
+ras 84983
+cad 84964
+_le 84843
+nas 84766
+epu 84750
+nça 84667
+lÃÂt 84526
+vo_ 84369
+lme 84183
+vid 83607
+ari 83463
+_ob 83255
+arl 83192
+pon 82569
+erm 82179
+_ag 82079
+erc 81926
+omp 81660
+ern 81272
+rar 81255
+ula 81242
+liz 81050
+rte 80905
+cid 80884
+_li 80772
+nes 80762
+ini 80705
+ça_ 80667
+inc 79801
+apr 79488
+col 79020
+_fu 78288
+ata 78030
+anç 77895
+ÃÂve 77668
+rti 77421
+uer 77205
+_is 76861
+_el 76744
+ate 76435
+sua 76204
+ató 76190
+mun 76054
+iro 76028
+nic 75748
+enc 74617
+ndi 74508
+alm 74360
+ien 74034
+tua 73961
+tri 73949
+aco 72481
+onc 72377
+mer 72006
+ifi 71996
+sas 71714
+oci 71439
+_ci 71069
+cul 70998
+dec 70984
+omu 70908
+_go 70886
+tre 70852
+cri 70848
+egi 70840
+alt 70663
+aba 70642
+ua_ 70600
+stã 70045
+pec 70032
+sel 69863
+aÃÂs 69857
+gar 69828
+_vo 69797
+tid 69690
+paà69542
+mbr 68992
+poi 68879
+sos 68720
+bro 68585
+bal 68558
+out 67910
+vol 67740
+sár 67648
+_ad 67495
+lem 67240
+rim 67148
+esc 67146
+fin 67022
+tin 66962
+erá 66938
+içã 66904
+ang 66832
+ssá 66758
+peu 66712
+mes 66602
+taç 66348
+esa 66289
+ues 66075
+ega 66014
+unt 65893
+nsi 65767
+ins 65764
+uan 65697
+mem 65615
+sol 65192
+roc 65153
+eme 65125
+leg 65061
+utr 65006
+did 64790
+ult 64722
+nce 64475
+ngu 64440
+tit 64432
+pes 64414
+_ba 64332
+ena 64312
+cos 64281
+equ 64167
+gun 64146
+ren 64122
+ge_ 64106
+ven 64068
+seu 64021
+_ce 63966
+dor 63825
+zer 63813
+_ju 63773
+rda 63297
+ond 63268
+ha_ 63173
+cei 63076
+mpl 62800
+ral 62761
+mei 62749
+erv 62728
+uçã 62657
+sit 62574
+_am 62533
+ret 62389
+nco 62192
+sej 62185
+bil 61670
+eja 61234
+ala 61069
+fun 61031
+orç 60927
+nec 60683
+laç 60680
+vis 60617
+enç 60479
+dia 60448
+uto 59992
+ert 59838
+alh 59797
+rea 59733
+_au 59721
+mar 59705
+ve_ 59647
+gos 59593
+aqu 59570
+po_ 59338
+dam 59015
+ns_ 58848
+ior 58832
+ois 58645
+cis 58506
+ani 58048
+aos 57972
+mit 57587
+rmo 57587
+smo 57387
+rab 57198
+rna 57084
+ero 56979
+ez_ 56968
+ama 56712
+inh 56449
+olv 56440
+_ab 56379
+cre 56359
+vos 56275
+env 56221
+até 56187
+im_ 56182
+ber 55838
+err 55747
+evi 55653
+_ho 55224
+_sã 54697
+ova 54692
+_cu 54604
+tim 54595
+us_ 54590
+_be 54505
+tir 54447
+fac 54424
+áve 54382
+sim 54372
+ape 54290
+zaç 54126
+anc 53891
+exi 53866
+vam 53844
+abe 53744
+imo 53348
+ust 53227
+_fr 53202
+ans 53142
+nov 53126
+nid 52806
+rev 52316
+soc 52293
+uag 52256
+éri 52249
+lte 52028
+jec 51947
+cla 51690
+rov 51623
+ete 51551
+vez 51469
+ove 51414
+ota 51380
+_ch 51354
+faz 51336
+caç 51210
+osi 51136
+alg 51099
+cen 50909
+olu 50812
+vas 50810
+nad 50699
+ima 50502
+nvo 50153
+ce_ 50028
+oi_ 49956
+med 49608
+foi 49475
+ble 49473
+_lu 49336
+iti 49309
+erd 49264
+ÃÂse 49262
+imi 49155
+_va 49123
+rod 49021
+gui 48920
+rmi 48761
+já_ 48505
+_já 48451
+dar 48343
+_op 48312
+aze 48102
+orr 47880
+esm 47588
+gur 47548
+rdo 47542
+dic 47503
+rog 47457
+ace 47363
+tud 47247
+_ra 47158
+rep 47107
+ja_ 47092
+oce 46987
+pa_ 46969
+ato 46787
+ext 46776
+_fe 46715
+rig 46715
+eis 46474
+_lo 46462
+erg 46349
+às_ 46238
+_nu 46221
+stá 46179
+_às 46163
+nve 46113
+_ef 45968
+_ec 45935
+içõ 45917
+pas 45851
+lgu 45756
+nac 45743
+iar 45520
+ego 45400
+mbi 45287
+eno 45014
+pli 44911
+lhe 44876
+dif 44566
+nçã 44493
+iga 44478
+agr 44394
+ui_ 44352
+sis 44313
+ive 44161
+lta 44100
+inf 43965
+ain 43885
+nsa 43866
+tec 43847
+apo 43700
+rca 43601
+rid 43543
+odu 43310
+nom 43196
+diz 43166
+isc 43150
+opa 43081
+tá_ 43027
+ço_ 42951
+igo 42926
+rit 42924
+tár 42904
+rre 42894
+_aq 42708
+ogr 42689
+rin 42672
+exe 42655
+ume 42645
+rça 42644
+ric 42628
+oca 42618
+mpe 42610
+vem 42529
+bor 42498
+olo 42375
+_ge 42219
+eus 42194
+_há 42107
+onf 41995
+bem 41976
+uir 41951
+isa 41893
+vei 41817
+cam 41789
+bat 41774
+tru 41739
+há_ 41650
+iam 41517
+bri 41511
+_ai 41431
+lha 41390
+cim 41319
+ava 41251
+oda 40944
+ris 40899
+exp 40815
+gor 40732
+_ar 40692
+rga 40557
+efi 40435
+les 40386
+clu 39996
+uas 39963
+gen 39921
+utu 39914
+iaç 39865
+lvi 39806
+rib 39728
+oje 39524
+_cl 39518
+eal 39444
+fei 39412
+can 39324
+sar 39324
+ovo 39044
+ibu 38845
+ocu 38701
+ers 38684
+bas 38639
+rno 38442
+_ti 38434
+dei 38236
+itá 38157
+cie 38101
+mic 38094
+siç 37940
+lim 37812
+pró 37812
+def 37805
+nan 37682
+atr 37680
+abo 37579
+uti 37576
+rob 37560
+los 37559
+bli 37437
+udo 37406
+tui 37402
+ple 37357
+cçã 37296
+ssu 37261
+rde 37242
+_du 37142
+en_ 37051
+lei 36993
+nor 36960
+arm 36942
+nai 36903
+sab 36797
+mat 36783
+ase 36700
+red 36690
+iad 36476
+_ir 36430
+sam 36411
+mod 36335
+obl 36315
+nis 36264
+upo 36243
+rqu 36117
+rup 36046
+bje 35927
+gem 35878
+ize 35876
+aso 35827
+ole 35786
+rav 35715
+num 35710
+rão 35665
+til 35559
+raz 35497
+obj 35343
+abi 35303
+xis 35138
+cur 35114
+isp 35053
+ham 34904
+ves 34770
+sÃÂv 34560
+icu 34314
+deb 34272
+aio 34235
+ola 34219
+rên 34195
+ÃÂci 34102
+via 34084
+lis 34066
+ite 34003
+ave 33982
+uaç 33981
+mel 33967
+nhe 33939
+luç 33923
+vim 33923
+ctu 33794
+eio 33699
+uga 33601
+_ha 33503
+tér 33503
+anh 33427
+ecu 33427
+gru 33299
+eli 33272
+ana 33271
+rom 33226
+atu 33066
+sub 33033
+arg 32998
+mon 32958
+eba 32935
+ote 32920
+nar 32789
+ibi 32786
+mil 32755
+vot 32742
+lev 32681
+las 32608
+ei_ 32561
+sõe 32555
+onh 32515
+dão 32248
+ced 32239
+_ev 32223
+ncl 32176
+ivi 31998
+_bo 31882
+áti 31853
+har 31795
+gia 31774
+ós_ 31712
+le_ 31701
+ian 31669
+tou 31625
+eva 31605
+rce 31597
+aut 31543
+_ga 31520
+çam 31412
+soa 31285
+tom 31251
+rie 31231
+lec 31184
+zad 31100
+_af 31078
+uin 31075
+nóm 30954
+lti 30791
+uda 30782
+rot 30730
+lia 30718
+ger 30678
+mul 30675
+maç 30533
+ene 30480
+plo 30453
+inu 30414
+onv 30377
+rme 30360
+nit 30309
+val 30302
+tab 30270
+ede 30265
+sul 30228
+lug 29994
+ga_ 29943
+nfo 29940
+che 29906
+uiç 29824
+eta 29800
+tig 29747
+il_ 29706
+ços 29676
+rto 29652
+ssà29651
+ife 29564
+ilh 29539
+ómi 29510
+nÃÂv 29505
+sca 29431
+van 29407
+eso 29402
+eda 29334
+lad 29332
+té_ 29311
+onó 29278
+egr 29247
+ale 29192
+efo 29174
+oma 29150
+nsu 29148
+sum 29124
+apl 29062
+ong 29054
+cip 29022
+vad 28993
+_tu 28987
+tai 28963
+nso 28922
+duz 28902
+ago 28876
+gis 28753
+hum 28735
+uad 28638
+_pl 28626
+gan 28504
+gum 28396
+igu 28355
+sec 28348
+uns 28236
+hec 28178
+jud 28137
+ipa 28090
+_só 27968
+iai 27965
+eti 27955
+mad 27857
+ane 27553
+cus 27522
+meu 27481
+orn 27394
+cta 27353
+isã 27307
+coo 27275
+uai 27231
+irm 27222
+nif 27147
+fal 27109
+_nà27032
+nua 27022
+fra 27013
+cit 26874
+rvi 26861
+ino 26703
+ânc 26696
+ign 26625
+ÃÂni 26623
+nsp 26545
+ãos 26488
+tân 26467
+gov 26399
+sco 26384
+púb 26352
+unc 26342
+úbl 26335
+ing 26260
+acç 26253
+_lh 26219
+gaç 26212
+rgu 26207
+lit 26201
+niz 26187
+gul 26047
+az_ 25997
+nio 25976
+inv 25968
+lib 25947
+ism 25916
+pet 25892
+só_ 25854
+apa 25853
+rtu 25751
+pal 25735
+pla 25651
+nat 25577
+on_ 25527
+rol 25525
+bra 25465
+ner 25412
+rai 25407
+je_ 25399
+_av 25326
+_de_ 1271377
+_que 1026748
+que_ 953637
+ment 732520
+_com 702983
+ção_ 653837
+nte_ 631529
+ente 630767
+_con 610081
+dos_ 520188
+_par 488876
+_est 453511
+_da_ 447050
+ação 424637
+amen 403844
+_do_ 399859
+nto_ 389892
+_pro 356433
+_em_ 343937
+ento 328752
+mos_ 326294
+ões_ 302718
+esta 299618
+para 298911
+das_ 298828
+_se_ 296889
+uma_ 295494
+_os_ 290633
+ara_ 287899
+são_ 282695
+ais_ 280181
+_pre 277090
+dade 273296
+não_ 269308
+ado_ 268678
+_não 268090
+_uma 267758
+pres 254206
+_um_ 245222
+idad 241999
+cons 237689
+_por 234422
+_des 232366
+_sen 231161
+tos_ 227231
+_no_ 227149
+_as_ 225794
+_dos 216796
+ade_ 212841
+ções 211318
+euro 209736
+_eur 209108
+tado 208479
+com_ 204352
+ria_ 203289
+cont 202804
+miss 198105
+enho 198026
+enta 197679
+ncia 197092
+sta_ 196847
+urop 194277
+ados 189376
+senh 186845
+nhor 186529
+omis 184652
+por_ 184114
+comi 181609
+ito_ 180276
+nos_ 172867
+_ser 172477
+este 170026
+_na_ 167765
+ica_ 167541
+_tra 167513
+_nos 167449
+_rel 166303
+ssão 166089
+tes_ 165773
+mas_ 165454
+rio_ 160645
+rela 160215
+ante 156612
+_res 155827
+ada_ 154550
+cia_ 153391
+dent 153316
+side 152999
+ndo_ 152074
+_mai 151759
+rope 151242
+_qua 149821
+ste_ 148348
+sso_ 145855
+issã 142229
+hor_ 140790
+_ao_ 139564
+inte 139027
+tar_ 136354
+res_ 136338
+tiva 136140
+iden 136089
+_das 136072
+_int 133726
+ênci 132512
+omo_ 132459
+como 132020
+resi 131414
+ros_ 130187
+esid 129880
+açõe 129491
+elat 129333
+_pel 127333
+mais 126103
+emos 125898
+_ter 121275
+segu 120739
+port 119510
+osta 119115
+_per 118482
+ntes 118302
+tica 117246
+tas_ 116589
+tant 116151
+esen 114640
+_sob 114405
+_dev 113073
+obre 112985
+_for 112823
+imen 112699
+_pos 112595
+ido_ 112112
+eito 111210
+lame 110729
+onse 110687
+espe 109522
+form 108918
+name 107666
+nter 107651
+_ass 106947
+_imp 106072
+orma 105989
+sobr 105972
+_pod 105901
+ião_ 105657
+iona 105182
+cess 105095
+ias_ 104701
+ário 104684
+_uni 104638
+ontr 104161
+_tem 104050
+_dep 104035
+pode 103742
+sent 103376
+lho_ 102754
+vel_ 100124
+eia_ 98114
+ser_ 98021
+amos 97919
+_tod 97707
+ora_ 97128
+post 97111
+_dir 96873
+cion 96806
+ctiv 95660
+_ent 95554
+elho 95387
+_pol 95043
+bre_ 94731
+_id_ 94458
+ios_ 94314
+part 93889
+_tam 93597
+ativ 93266
+lida 93082
+tamb 92204
+ambé 92091
+bém_ 92085
+mbém 92084
+nião 92026
+ame_ 91965
+deve 91878
+ores 91551
+ker_ 91498
+_spe 90807
+_mui 90519
+muit 90504
+_nam 90465
+aker 90400
+spea 90374
+peak 90339
+eake 90333
+tão_ 89993
+esse 89966
+ÃÂtic 89575
+dire 89434
+tóri 89344
+_pri 88994
+resp 88873
+_dis 88213
+ses_ 87798
+raçã 86634
+_mas 86572
+polà86168
+utad 85702
+fica 85260
+puta 85206
+lÃÂti 84525
+olÃÂt 84410
+ram_ 84408
+eput 84071
+prop 83985
+depu 83933
+opei 83866
+peia 83787
+lmen 83554
+_reg 83150
+_ref 83116
+esso 82992
+ecti 82841
+nas_ 82380
+entr 82066
+ssa_ 82026
+stad 81879
+des_ 81865
+parl 81842
+tivo 81564
+arla 80901
+rlam 80791
+comp 80115
+rese 79070
+_apr 78781
+ntos 78677
+uniã 78648
+_rec 78561
+_esp 78462
+sse_ 78300
+ntra 78067
+iva_ 77893
+_seg 77864
+uito 77859
+ório 77778
+pelo 76692
+anto 76283
+atór 75683
+adas 75661
+_ess 75498
+tura 75174
+dese 75022
+noss 74199
+mpre 74130
+_nes 73886
+ras_ 73783
+eraç 73635
+cto_ 73623
+_sua 73007
+alme 72551
+star 72207
+ropo 72001
+eiro 71885
+poss 71772
+conc 71587
+orta 71451
+arti 71381
+ança 71044
+comu 70691
+ient 70373
+ico_ 70365
+isso 70243
+impo 70023
+ific 69823
+stão 69736
+ter_ 69719
+paÃÂs 69533
+_paà69532
+quer 68996
+cial 68930
+essa 68826
+sos_ 68608
+sas_ 68502
+liza 68470
+trat 68307
+ecto 68265
+sári 67648
+embr 67147
+rar_ 67106
+dest 67052
+ição 66904
+spec 66806
+lató 66492
+ssár 66272
+ades 66161
+ial_ 65991
+stas 65983
+opeu 65857
+todo 65795
+estã 65746
+selh 65736
+eira 65663
+nsel 65643
+ando 65222
+elo_ 65209
+mpor 64395
+itos 64311
+ida_ 63887
+nal_ 63821
+nda_ 63686
+_aco 63414
+ques 63371
+ntar 63220
+mbro 63055
+outr 62758
+ução 62657
+opos 62532
+_seu 62462
+quan 62168
+ÃÂvel 61988
+erá_ 61656
+cas_ 61548
+aria 61462
+tem_ 61179
+_out 60930
+_alt 60883
+_ou_ 60044
+ela_ 59556
+cos_ 59412
+_ins 59290
+ress 59241
+_dec 59190
+ista 59161
+nece 59121
+zer_ 58914
+uest 58638
+titu 58441
+_ver 58351
+ossa 58311
+bili 58260
+nest 58248
+_lan 58185
+empr 58170
+aos_ 57932
+qual 57875
+_cri 57542
+_aos 57512
+tal_ 57484
+econ 57449
+hora 57013
+proc 57013
+acto 56536
+cord 56520
+iste 56310
+idas 56283
+emen 56006
+ngua 55979
+ária 55954
+eria 55715
+reit 55622
+eces 55510
+onst 55454
+pela 55389
+abal 55369
+lica 55120
+raba 54948
+rece 54881
+trab 54802
+_mem 54659
+balh 54446
+_são 54437
+_ten 54418
+memb 54397
+rata 54293
+ocia 54248
+rios 54186
+izaç 54126
+nça_ 54067
+ivo_ 53896
+acio 53865
+ecis 53667
+sto_ 53609
+angu 53468
+irei 53458
+demo 53434
+_fac 53396
+rem_ 53380
+pera 53247
+stit 53209
+_nec 53198
+tera 53141
+icas 53138
+lang 53113
+tada 53083
+seja 53034
+nha_ 52966
+tran 52778
+sua_ 52565
+_col 52549
+age_ 52497
+peu_ 52448
+lati 52382
+uage 52212
+guag 52161
+iro_ 52001
+_fun 51875
+soci 51800
+_gra 51570
+rte_ 51494
+ende 51333
+rma_ 51288
+omun 51173
+cida 51159
+oder 51104
+onte 50843
+odos 50830
+_mes 50821
+ura_ 50721
+rtan 50691
+_sem 50671
+ject 50653
+vos_ 50452
+ntre 50426
+cado 50297
+dame 50006
+posi 49926
+alte 49900
+_pes 49869
+lter 49754
+_alg 49730
+_faz 49463
+_foi 49349
+aÃÂse 49242
+ÃÂses 49241
+muni 49234
+taçã 49233
+foi_ 49137
+smo_ 49090
+ilid 49080
+_act 49060
+_exi 48840
+osso 48816
+espo 48615
+nsti 48606
+prim 48584
+_já_ 48451
+volv 48428
+nde_ 48426
+eita 48318
+tern 48036
+nvol 48013
+_fin 47993
+tre_ 47969
+prov 47936
+envo 47931
+rime 47796
+estr 47696
+esti 47476
+medi 47429
+vas_ 47370
+bros 47218
+vida 47150
+tido 46999
+ira_ 46898
+_emp 46877
+regi 46847
+tame 46833
+icos 46820
+tari 46747
+dida 46488
+nta_ 46479
+_nov 46343
+_rea 46336
+anos 46280
+fina 46223
+unid 46207
+rans 46174
+_às_ 46161
+_sej 46154
+zaçã 46043
+ois_ 45941
+içõe 45917
+onsi 45914
+eis_ 45809
+egui 45512
+ever 45499
+undo 45484
+onal 45464
+roce 45361
+apre 45344
+algu 45216
+ver_ 44905
+laçã 44655
+nção 44493
+edid 44481
+clar 44381
+gar_ 44351
+idos 44296
+_ele 44284
+refe 44143
+_iss 44141
+serv 44093
+efer 44088
+der_ 44080
+_me_ 44077
+meir 44016
+imei 43951
+ermi 43899
+_inf 43789
+icaç 43716
+_ind 43638
+ordo 43595
+rmos 43575
+egur 43486
+está 43430
+odo_ 43374
+gost 43370
+ero_ 43349
+tra_ 43337
+_med 43327
+cent 43326
+_soc 43303
+corr 43252
+onta 43240
+ual_ 43237
+sist 43211
+gura 43052
+ador 42956
+rodu 42848
+_vez 42825
+ntro 42824
+tári 42735
+_gos 42703
+_aqu 42697
+fund 42659
+naci 42354
+_exe 42326
+ropa 42317
+ecer 42220
+enti 42213
+_ano 42209
+itar 42098
+fact 42073
+rant 41980
+assi 41956
+_diz 41932
+conf 41904
+_man 41882
+eus_ 41829
+caçã 41769
+cer_ 41734
+pens 41694
+orça 41609
+tend 41534
+inda 41519
+ema_ 41461
+rect 41433
+_há_ 41417
+_min 41351
+_apo 41310
+erna 41264
+_ape 41227
+erem 41179
+_eco 41153
+stru 41150
+aliz 41112
+mesm 41036
+uer_ 41007
+_pen 40975
+opa_ 40947
+stá_ 40946
+pass 40908
+senv 40822
+inst 40814
+fere 40695
+seu_ 40645
+rand 40616
+_exp 40567
+_dem 40523
+ande 40523
+vez_ 40410
+stra 40368
+utro 40302
+ral_ 40127
+ider 40036
+spon 40018
+faze 39972
+_ain 39927
+_pas 39862
+_agr 39817
+ençã 39756
+aind 39697
+acor 39656
+deci 39547
+olvi 39538
+nsid 39313
+inha 39288
+arte 39158
+rogr 39050
+prog 39040
+trib 38878
+plic 38838
+vame 38837
+ribu 38756
+peit 38735
+spei 38701
+tent 38693
+_inc 38677
+term 38588
+asse 38575
+eve_ 38453
+tico 38390
+tir_ 38344
+dar_ 38292
+eres 38291
+uran 38281
+reci 38279
+alho 38277
+lega 38264
+eja_ 38098
+bate 38068
+reco 38018
+isto 37986
+tro_ 37973
+rado 37816
+nida 37774
+merc 37742
+_pró 37713
+mina 37670
+toda 37624
+_car 37571
+_enc 37520
+rdo_ 37472
+real 37402
+endo 37330
+cção 37296
+lema 37233
+_cas 37211
+apoi 37179
+cime 37127
+unto 37051
+erca 37043
+aqui 37012
+irec 36985
+_def 36943
+azer 36937
+solu 36918
+_rep 36866
+_mer 36839
+utur 36792
+ável 36750
+pect 36731
+ivam 36697
+nais 36624
+gran 36525
+prec 36486
+dera 36409
+prob 36264
+tudo 36252
+robl 36174
+itui 36164
+ano_ 36055
+rias 35956
+iar_ 35898
+umen 35761
+oble 35709
+rão_ 35617
+blem 35560
+bem_ 35437
+bjec 35390
+_dif 35355
+obje 35343
+_obj 35339
+_ace 35293
+_mod 35232
+osiç 35104
+tor_ 35097
+alid 35060
+prod 35035
+sem_ 34996
+xist 34977
+uas_ 34939
+veis 34933
+_num 34932
+issá 34930
+exis 34868
+_vis 34867
+aram 34712
+udo_ 34689
+rent 34641
+dore 34567
+sÃÂve 34560
+gem_ 34475
+pont 34474
+forç 34444
+itua 34360
+disp 34329
+lar_ 34321
+_deb 34248
+icul 34227
+omen 34175
+rênc 34110
+_pon 34104
+ivos 34061
+ntid 34057
+ntad 34027
+ivas 33965
+feit 33953
+oluç 33919
+rdad 33890
+ranç 33721
+enas 33627
+unda 33594
+ntem 33567
+pena 33491
+raçõ 33440
+temo 33355
+los_ 33264
+stem 33249
+apro 33205
+_ant 33199
+cias 33152
+grup 33146
+uant 33117
+ceir 33075
+maio 33065
+erno 32914
+nica 32868
+melh 32865
+_sub 32864
+cond 32857
+sim_ 32834
+ssos 32796
+téri 32791
+_vot 32699
+_bas 32639
+enha 32636
+onto 32603
+sões 32555
+erda 32540
+dem_ 32511
+assa 32466
+rupo 32419
+ita_ 32410
+_gru 32276
+icia 32264
+caso 32239
+tros 32126
+orte 32109
+deba 32106
+tuaç 32087
+over 32077
+remo 32027
+_sit 32024
+ebat 31978
+vime 31898
+situ 31891
+car_ 31880
+uir_ 31867
+perm 31811
+nclu 31797
+átic 31742
+essá 31509
+_bem 31497
+vist 31480
+iliz 31470
+blic 31410
+tere 31389
+ctua 31258
+pois 31187
+cada 31184
+esmo 31155
+_efe 31146
+assu 31143
+rida 31108
+onai 31035
+_cla 31011
+pess 30992
+oces 30973
+cria 30898
+aior 30699
+ssoa 30695
+izad 30596
+_cor 30476
+_mat 30440
+uaçã 30368
+conv 30334
+_nas 30332
+cio_ 30323
+anti 30264
+abor 30256
+icar 30206
+ugar 30186
+_nom 30177
+uand 30171
+ntan 30149
+orre 30041
+emas 30023
+rama 30000
+luga 29957
+tema 29942
+inan 29928
+_lug 29922
+come 29900
+rinc 29899
+onti 29884
+_atr 29873
+prin 29830
+sper 29811
+rcad 29786
+cole 29685
+eram 29664
+ogra 29595
+ssim 29572
+_cer 29556
+nfor 29541
+ate_ 29510
+tou_ 29482
+_tal 29465
+ómic 29443
+lvim 29438
+_mel 29420
+nÃÂve 29394
+essi 29345
+rtic 29331
+_mil 29190
+nómi 29170
+nome 29145
+onóm 29140
+gram 29109
+ssÃÂv 29096
+enci 29076
+las_ 29040
+conó 29028
+_apl 29004
+ssas 28900
+sar_ 28898
+nstr 28894
+lhor 28837
+onde 28819
+ços_ 28802
+luçã 28720
+_aut 28622
+tamo 28613
+alar 28610
+ntin 28606
+ior_ 28596
+ermo 28593
+_amb 28543
+les_ 28492
+siçã 28453
+efor 28398
+refo 28368
+iaçã 28315
+itár 28263
+pare 28249
+ode_ 28197
+éria 28191
+ctor 28163
+abil 28154
+eali 27982
+ntal 27977
+evem 27942
+iais 27922
+stam 27911
+_sol 27862
+_men 27805
+temp 27512
+cert 27488
+prom 27423
+spos 27408
+nada 27397
+rmaç 27394
+_meu 27384
+egis 27372
+odem 27368
+dize 27367
+isão 27307
+feri 27280
+terr 27278
+qui_ 27260
+inal 27255
+ase_ 27244
+_cid 27157
+eren 27126
+oleg 27121
+ulta 27075
+teme 27022
+uais 27019
+rova 26990
+arec 26952
+aso_ 26898
+oper 26898
+actu 26897
+leva 26845
+nder 26840
+icad 26832
+ânci 26677
+_leg 26666
+ibil 26634
+onhe 26620
+reve 26619
+_ext 26591
+conh 26589
+_fal 26549
+_nÃÂv 26539
+lara 26533
+ata_ 26508
+uro_ 26502
+ãos_ 26485
+minh 26391
+_sec 26354
+públ 26335
+úbli 26334
+vern 26305
+nanc 26260
+_coo 26255
+reso 26187
+izer 26180
+apen 26165
+tais 26128
+ular 26124
+fici 26123
+nova 26114
+rada 26109
+stri 26105
+cult 26075
+gora 26028
+_ago 26026
+nseg 26023
+_red 26017
+auto 26001
+_lhe 25993
+mar_ 25992
+apli 25936
+nist 25930
+_inv 25870
+tenh 25859
+rest 25826
+ossà25825
+_só_ 25817
+gove 25793
+teri 25734
+dica 25723
+unta 25705
+ompr 25686
+oria 25669
+nar_ 25668
+rque 25665
+niza 25559
+rmit 25539
+esol 25512
+agor 25447
+çame 25432
+ispo 25369
+ambi 25350
+upo_ 25322
+imos 25318
+eral 25266
+ceit 25248
+rior 25220
+ismo 25182
+ensa 25170
+agem 25153
+mple 25114
+_tom 25099
+rno_ 25092
+imo_ 25087
+atér 25081
+egun 25019
+maté 25019
+gund 25000
+rçam 24972
+regu 24861
+ltur 24778
+iver 24775
+lgum 24767
+nhec 24713
+empo 24702
+diss 24701
+semp 24672
+ssem 24662
+ecid 24656
+orqu 24656
+enco 24633
+enso 24612
+ervi 24611
+grad 24606
+_mar 24594
+nten 24594
+cipa 24582
+mÃÂni 24582
+gula 24581
+dadã 24538
+uns_ 24515
+elaç 24507
+bora 24467
+iado 24437
+_orç 24431
+nho_ 24400
+info 24374
+timo 24343
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/da.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/da.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/da.ngp (working copy)
@@ -1,1002 +1,3060 @@
-# NgramProfile generated at Sat Sep 25 16:09:48 EEST 2004 for Nutch Language Identification
-ngram_count 17699911
-_ 1111102
-e 974465
-r 537306
-n 446493
-t 435548
-i 403270
-d 361673
-s 355743
-a 327047
-o 310453
-l 295400
-g 274591
-e_ 229608
-m 215081
-er 209387
-r_ 200928
-de 199418
-k 188531
-f 168601
-t_ 167061
-en 154410
-v 139136
-n_ 110991
-et 107645
-er_ 104308
-re 99548
-u 99046
-g_ 94526
-or 90596
-p 89394
-h 81884
-ge 79243
-b 78536
-nd 74686
-in 74443
-te 73724
-et_ 71884
-ti 71232
-fo 67967
-en_ 65716
-for 65286
-Ã¥ 63662
-at 63390
-an 62280
-ne 60912
-me 60220
-æ 59223
-le 58794
-ig 58754
-ed 57609
-st 57253
-om 53460
-el 52967
-ng 50856
-ke 50228
-d_ 48887
-ø 48828
-og 48810
-li 48429
-vi 48003
-l_ 47836
-il 47665
-is 46517
-s_ 46509
-sk 44877
-der 44050
-es 43711
-ve 41674
-se 41558
-det 41381
-m_ 40545
-ar 40523
-ing 38707
-al 37610
-den 36795
-be 35680
-j 35529
-de_ 34616
-nde 34530
-on 33256
-af 32317
-or_ 32044
-Ã¥_ 30441
-ri 30204
-ni 29934
-si 29709
-il_ 29243
-eg 29230
-re_ 28963
-til 28370
-em 28076
-ke_ 27854
-ere 27757
-ik 27445
-la 26867
-ne_ 26813
-ta 26777
-y 26533
-ll 25803
-id 25762
-ns 25266
-lig 24909
-ko 24676
-so 24448
-f_ 24197
-ed_ 24168
-ra 23823
-io 23464
-he 23341
-ter 23332
-ka 23262
-mi 22941
-ha 22926
-ag 22621
-ro 22400
-nt 22161
-es_ 22101
-ger 22047
-je 21927
-ør 21820
-ge_ 21757
-ls 21580
-and 21487
-ion 21205
-tt 21201
-lle 21168
-ss 20883
-nin 20565
-ning 20430
-te_ 20381
-un 20336
-mm 20072
-i_ 20047
-kk 19980
-kke 19844
-nge 19835
-ng_ 19621
-gt 18918
-med 18904
-end 18886
-gs 18808
-men 18797
-ske 18757
-c 18749
-som 18659
-els 18561
-rs 18383
-tr 18341
-rn 18239
-ud 18235
-tte 17863
-ede 17835
-ol 17833
-om_ 17824
-di 17776
-le_ 17765
-op 17763
-ær 17636
-ing_ 17293
-gen 17236
-lse 17224
-ind 17109
-ma 17108
-else 17037
-ur 16980
-ige 16779
-it 16708
-ern 16450
-ste 16360
-am 16331
-iv 16197
-ar_ 15962
-ikk 15896
-på 15863
-ikke 15862
-se_ 15523
-ig_ 15274
-fr 15157
-rne 15042
-der_ 14977
-erne 14646
-inge 14468
-isk 14457
-kke_ 14433
-ver 14379
-sa 14335
-kt 14333
-ds 14144
-rt 14116
-va 14083
-ent 14033
-an_ 13867
-eg_ 13844
-pr 13762
-jeg 13707
-ru 13488
-nde_ 13397
-ende 13329
-ret 13313
-har 13273
-rd 13242
-igt 13233
-del 13131
-ler 13016
-dr 12845
-rne_ 12832
-ek 12794
-ld 12735
-a_ 12712
-mme 12524
-så 12502
-res 12471
-nn 12447
-vil 12426
-hed 12411
-one 12163
-pa 12036
-sp 12033
-rin 12026
-ide 12009
-nne 11960
-gt_ 11839
-ske_ 11795
-ska 11778
-hv 11735
-eu 11729
-kom 11592
-dl 11577
-ger_ 11552
-ige_ 11519
-ione 11509
-sl 11507
-ter_ 11320
-ere_ 11151
-den_ 11069
-man 10992
-æn 10913
-iss 10867
-ov 10777
-omm 10770
-nte 10763
-age 10702
-lt 10684
-k_ 10583
-bl 10537
-dt 10411
-ring 10301
-pe 10288
-na 10218
-ie 10158
-fø 10130
-und 10124
-komm 10123
-ner 10120
-nd_ 10098
-Ã¥r 10009
-må 9968
-rl 9911
-ser 9910
-to 9901
-rb 9858
-gr 9855
-get 9849
-væ 9838
-ett 9756
-tio 9752
-rk 9682
-tion 9621
-ene 9542
-da 9525
-od 9522
-tte_ 9515
-tet 9477
-lse_ 9437
-ens 9417
-ive 9413
-vo 9395
-kr 9373
-enn 9299
-mis 9287
-iske 9282
-enne 9249
-rm 9215
-nk 9192
-nen 9049
-igt_ 9018
-Ã¥d 9003
-ati 8982
-lan 8972
-uro 8935
-gen_ 8927
-eur 8852
-euro 8814
-tig 8762
-gi 8731
-get_ 8716
-ell 8695
-ors 8678
-sta 8675
-al_ 8627
-ft 8624
-øre 8614
-ad 8604
-ts 8565
-fors 8534
-ren 8526
-lige 8514
-det_ 8495
-no 8453
-ore 8431
-nger 8317
-mer 8307
-rg 8298
-rop 8291
-ev 8245
-ord 8218
-lle_ 8173
-urop 8137
-sig 8135
-res_ 8066
-rer 8001
-ove 7998
-ej 7981
-ære 7940
-inde 7913
-gh 7908
-kon 7892
-ce 7806
-ghe 7782
-pro 7745
-ghed 7742
-lem 7738
-vær 7738
-igh 7725
-eri 7684
-ighe 7684
-vor 7669
-dv 7657
-ngs 7609
-orm 7607
-ver_ 7596
-po 7582
-ale 7580
-ler_ 7574
-ul 7571
-ang 7540
-u_ 7515
-ræ 7504
-elle 7500
-ssi 7465
-onen 7460
-str 7446
-eli 7442
-ette 7437
-ker 7413
-mo 7394
-fa 7363
-kal 7342
-kan 7320
-ans 7306
-tn 7304
-ku 7273
-vis 7262
-sio 7254
-sion 7245
-ege 7234
-ede_ 7172
-tet_ 7145
-tal 7142
-form 7139
-før 7123
-ef 7113
-iti 7112
-mmi 7100
-miss 7094
-em_ 7017
-elig 7004
-nder 6949
-ommi 6939
-mmis 6934
-over 6890
-nne_ 6887
-sm 6880
-Ã¥de 6867
-nen_ 6846
-dle 6843
-ho 6830
-tni 6828
-Ã¥r_ 6818
-ings 6815
-ngen 6793
-ande 6698
-tnin 6691
-ag_ 6666
-sæ 6663
-ndr 6626
-sen 6593
-ente 6571
-dig 6562
-ga 6555
-kl 6546
-tu 6517
-bes 6500
-fe 6473
-lag 6461
-red 6435
-lin 6431
-ks 6412
-dre 6409
-ment 6405
-kal_ 6387
-skal 6383
-ved 6325
-ab 6321
-sam 6321
-æl 6310
-par 6284
-v_ 6283
-bet 6246
-est 6224
-ner_ 6218
-ve_ 6218
-ill 6206
-ak 6194
-rå 6186
-fi 6158
-Ã¥l 6146
-ir 6123
-on_ 6100
-fre 6086
-tag 6083
-ssio 6071
-nes 6043
-land 5968
-as 5965
-lit 5909
-så_ 5899
-lde 5898
-rbe 5884
-rer_ 5872
-råd 5866
-av 5822
-ven 5815
-im 5804
-ut 5801
-atio 5788
-sse 5777
-dels 5759
-and_ 5745
-ers 5745
-os 5741
-tage 5738
-lig_ 5728
-hede 5715
-issi 5705
-br 5698
-ist 5690
-var 5666
-bi 5652
-if 5643
-lo 5593
-ller 5556
-ns_ 5544
-ling 5541
-eder 5537
-st_ 5534
-tat 5501
-ia 5484
-kel 5480
-kn 5465
-lu 5463
-ogs 5449
-ten 5440
-ba 5433
-ms 5431
-min 5424
-sla 5395
-gså 5390
-ekt 5388
-gså_ 5386
-også 5386
-han 5374
-ndl 5355
-ste_ 5353
-ame 5329
-være 5326
-fra 5314
-hr 5313
-ion_ 5307
-rem 5301
-hed_ 5294
-rla 5286
-reg 5266
-ate 5254
-ser_ 5254
-is_ 5242
-iden 5240
-all 5217
-arl 5188
-kti 5187
-old 5187
-dett 5184
-dn 5161
-nden 5155
-ci 5108
-unde 5088
-rt_ 5078
-ret_ 5067
-rh 5057
-råde 5048
-dt_ 5023
-tiv 5019
-oli 5012
-frem 5007
-des 5005
-ligt 4983
-denn 4981
-ød 4980
-rma 4963
-tæ 4930
-gern 4915
-lt_ 4909
-ra_ 4909
-tis 4889
-erin 4868
-rke 4867
-læ 4849
-alt 4846
-ale_ 4838
-orma 4833
-tra 4828
-udv 4811
-ndel 4809
-mål 4804
-tid 4800
-sk_ 4777
-sy 4769
-ble 4764
-lg 4763
-gg 4759
-jd 4749
-el_ 4748
-fte 4744
-alle 4733
-kni 4733
-tem 4733
-hol 4713
-nter 4708
-rst 4688
-amen 4679
-lam 4662
-gel 4654
-ære_ 4643
-rde 4619
-hold 4612
-gru 4609
-mer_ 4601
-arb 4586
-yd 4556
-lame 4549
-ejd 4545
-ort 4545
-tere 4544
-emm 4540
-arbe 4528
-bej 4528
-bejd 4527
-rbej 4527
-dis 4518
-parl 4512
-arla 4511
-rlam 4509
-gø 4504
-o_ 4496
-mand 4482
-pl 4480
-gør 4467
-slag 4462
-pæ 4460
-gl 4456
-pol 4451
-orb 4435
-sti 4428
-eres 4424
-knin 4423
-stem 4387
-emme 4381
-fæ 4379
-isk_ 4370
-esk 4361
-nsk 4339
-sv 4324
-ænd 4324
-forb 4312
-rsl 4308
-tisk 4305
-opæ 4287
-ropæ 4269
-liti 4251
-poli 4250
-bli 4248
-olit 4241
-yn 4240
-rman 4228
-tø 4222
-ens_ 4205
-mod 4205
-ores 4188
-rsla 4185
-æi 4185
-æis 4185
-opæi 4180
-pæi 4180
-pæis 4180
-æisk 4178
-me_ 4167
-hvi 4166
-ntet 4152
-eret 4133
-gge 4114
-orsl 4112
-art 4105
-ug 4067
-rf 4059
-dere 4055
-ndi 4042
-ets 4036
-dre_ 4027
-ndre 4025
-rli 4022
-lk 4015
-rede 4009
-oner 3993
-kab 3991
-gå 3988
-hvo 3978
-hvor 3975
-amm 3963
-skab 3958
-tern 3957
-hand 3956
-ty 3943
-amme 3934
-lag_ 3930
-vis_ 3929
-ff 3927
-tor 3924
-des_ 3921
-mel 3909
-rlig 3905
-sse_ 3903
-sen_ 3874
-sto 3869
-hen 3867
-nst 3866
-giv 3857
-lev 3847
-nog 3841
-rr 3832
-ems 3831
-mu 3823
-ise 3819
-æg 3811
-ele 3804
-les 3797
-opa 3774
-ørg 3774
-nu 3773
-stat 3771
-ker_ 3761
-nc 3761
-ropa 3758
-vet 3746
-ør_ 3744
-pp 3729
-rett 3710
-elt 3707
-ts_ 3707
-ber 3706
-dem 3704
-gan 3699
-are 3694
-mmer 3688
-edl 3676
-ten_ 3663
-ken 3639
-æs 3634
-dvi 3632
-stø 3591
-mr 3586
-lli 3585
-ite 3581
-tik 3581
-dlem 3576
-fin 3576
-føre 3576
-edle 3574
-rig 3574
-medl 3572
-este 3571
-val 3566
-gti 3562
-dri 3558
-ny 3555
-mæ 3554
-gsm 3549
-tate 3546
-sf 3541
-gtig 3538
-lut 3525
-akt 3522
-mt 3510
-tæn 3508
-vet_ 3508
-lv 3499
-fter 3497
-ok 3496
-små 3493
-sker 3491
-omme 3487
-dst 3482
-tale 3471
-isse 3459
-pø 3459
-liv 3458
-spø 3456
-nge_ 3455
-us 3455
-ille 3453
-nds 3445
-pør 3441
-spør 3441
-pørg 3440
-lser 3439
-iver 3438
-dg 3431
-nske 3420
-æt 3407
-led 3402
-eks 3396
-fore 3396
-øj 3396
-ater 3387
-kun 3386
-ive_ 3385
-pa_ 3384
-jde 3376
-her 3375
-opa_ 3374
-dni 3373
-dnin 3371
-nat 3371
-kri 3370
-andl 3344
-ffe 3344
-gere 3336
-run 3334
-oc 3328
-bru 3327
-fæl 3325
-rund 3319
-eget 3315
-yde 3313
-vn 3296
-rti 3288
-vend 3288
-sær 3280
-bo 3274
-nal 3262
-ad_ 3260
-ess 3252
-nem 3250
-ene_ 3248
-sid 3234
-sik 3226
-lge 3222
-øre_ 3215
-mme_ 3208
-ejde 3201
-fl 3201
-Ã¥l_ 3185
-gels 3177
-vid 3175
-do 3170
-rel 3165
-vore 3165
-du 3164
-df 3161
-sst 3149
-sæt 3133
-int 3128
-ener 3127
-per 3127
-su 3118
-live 3117
-ndig 3116
-tl 3115
-at_ 3113
-kte 3113
-gn 3112
-gsmå 3112
-hel 3112
-gøre 3107
-gle 3102
-rat 3100
-eds 3098
-nå 3077
-rgs 3074
-sel 3071
-ktiv 3068
-ørgs 3068
-fu 3048
-rre 3048
-ons 3046
-mf 3042
-tro 3037
-ænk 3037
-ran 3031
-ppe 3030
-lsen 3028
-mar 3026
-tel 3023
-drin 3021
-igti 3017
-rv 3015
-ien 3008
-udvi 3007
-ert 3003
-inte 2997
-rug 2996
-smål 2995
-uni 2990
-lere 2978
-meg 2978
-mege 2969
-rgsm 2968
-slu 2960
-diss 2944
-grun 2941
-mp 2931
-brug 2929
-give 2925
-esl 2919
-mul 2914
-slut 2914
-bliv 2911
-age_ 2909
-ib 2905
-eve 2904
-att 2902
-rge 2895
-ets_ 2893
-rdi 2879
-tur 2873
-lede 2868
-uk 2868
-tti 2858
-ik_ 2843
-orh 2843
-in_ 2842
-ob 2842
-rend 2842
-nv 2839
-rfo 2831
-sfo 2831
-forh 2830
-ly 2820
-eft 2819
-efte 2804
-kla 2803
-itet 2800
-lø 2799
-omr 2799
-hø 2797
-Ã¥de_ 2795
-ris 2792
-mrå 2788
-mråd 2788
-erf 2787
-lles 2787
-dli 2783
-tre 2780
-ttig 2780
-nt_ 2778
-eh 2774
-eren 2773
-næ 2772
-go 2771
-områ 2768
-ford 2766
-tænk 2761
-org 2747
-of 2742
-hav 2729
-Ã¥det 2729
-dan 2727
-ona 2725
-ali 2708
-syn 2707
-eb 2701
-pri 2699
-blev 2695
-ligh 2695
-ster 2693
-agt 2685
-iser 2683
-till 2681
-kt_ 2679
-dag 2676
-ep 2675
-sfor 2671
-od_ 2668
-ip 2660
-let 2658
-ys 2653
-øs 2647
-tan 2646
-ørs 2644
-uli 2637
-dd 2629
-læg 2628
-sige 2625
-ærk 2614
-ave 2613
-p_ 2609
-mil 2608
-elt_ 2601
-æll 2585
-ange 2582
-ld_ 2582
-sat 2578
-sva 2573
-ælle 2572
-ered 2564
-rfor 2564
-gra 2563
-ial 2563
-abe 2562
-ky 2561
-ulig 2560
-ndt 2558
-ændr 2558
-nis 2555
-gte 2552
-onal 2549
-itik 2547
-rsk 2547
-yt 2541
-tli 2533
-nio 2531
-tigh 2528
-mål_ 2522
-for_ 2516
-pu 2512
-nkt 2504
-nion 2500
-sø 2499
-stor 2498
-unio 2494
-tlig 2492
-nes_ 2491
-ket 2487
-ast 2486
-tå 2486
-len 2484
-sn 2484
-mmen 2481
-ørst 2477
-rø 2474
-muli 2473
-hvis 2467
-ier 2464
-fæll 2463
-id_ 2460
-gang 2458
-ire 2458
-sag 2456
-nl 2453
-elv 2451
-ndri 2445
-tige 2445
-kker 2435
-vir 2433
-iona 2432
-ager 2427
-atte 2426
-etæ 2426
-tels 2426
-oge 2424
-ekti 2419
-lems 2419
-bø 2416
-nce 2415
-Ã¥e 2413
-irk 2412
-lad 2409
-stå 2407
-bu 2406
-øde 2405
-deli 2403
+# NgramProfile generated at Tue May 31 00:53:37 CEST 2005 for Nutch Language Identification
+e 20981454
+r 11475505
+n 9740774
+t 9301113
+i 8626785
+d 7768850
+s 7747768
+a 7395357
+o 6588927
+l 6400930
+g 5887264
+m 4647402
+k 4044832
+f 3574743
+v 2936426
+p 2282054
+u 2244240
+h 1727909
+b 1710646
+Ã¥ 1325891
+æ 1259099
+ø 1024574
+j 756110
+y 563434
+c 448772
+é 54755
+w 30625
+z 27837
+q 21185
+x 17337
+ö 7084
+à6201
+è 6147
+á 3021
+à2588
+ü 2224
+ê 2205
+ó 1909
+ä 1872
+ô 685
+ç 639
+ò 435
+ñ 396
+ú 374
+î 338
+û 312
+ß 268
+ù 268
+â 248
+ã 243
+ï 145
+º 84
+ë 54
+ì 25
+õ 8
+µ 6
+ý 4
+ð 2
+ª 1
+e_ 5007627
+er 4445778
+r_ 4252197
+de 4183228
+t_ 3559737
+en 3316786
+_d 2490574
+n_ 2399211
+et 2271639
+_s 2155538
+re 2087811
+_a 2086772
+_f 2048213
+g_ 2007171
+or 1940540
+_e 1864053
+ge 1731006
+_o 1683534
+nd 1615490
+in 1571996
+te 1569928
+_i 1536462
+ti 1512710
+fo 1440675
+_m 1427457
+an 1426818
+me 1357549
+at 1355095
+ne 1275314
+le 1264319
+ig 1212108
+st 1210299
+ed 1206130
+_v 1201523
+ke 1154423
+_p 1152814
+el 1147715
+_h 1143216
+ng 1131766
+d_ 1131355
+om 1114856
+i_ 1099929
+s_ 1085061
+li 1033500
+_t 1025702
+og 1018560
+l_ 1016397
+il 997364
+vi 994450
+es 950057
+sk 933607
+_b 920275
+is 917264
+se 906593
+ve 888202
+ar 877836
+m_ 860322
+_k 825550
+al 796329
+be 784120
+on 709774
+af 682169
+ni 647380
+la 645205
+ri 640117
+Ã¥_ 636809
+si 620076
+em 609446
+eg 597629
+_n 590893
+ta 583447
+_g 563756
+ll 561987
+ns 559159
+_u 546795
+ag 543392
+ik 540103
+f_ 529229
+ra 525128
+so 516599
+ha 493799
+ko 491604
+id 490657
+he 488993
+nt 485843
+_l 484585
+mi 475047
+ro 473287
+_r 468430
+ka 467852
+ls 466360
+io 465685
+je 457850
+ør 453884
+am 438176
+un 430693
+ss 429151
+tt 426280
+kk 422216
+mm 406238
+rs 404659
+ma 402816
+ud 391848
+gt 390824
+tr 387915
+gs 383625
+rn 374915
+ær 374212
+ol 372663
+op 370628
+di 365678
+ur 352477
+it 350754
+sp 345238
+_j 344609
+på 334142
+fr 325519
+ds 319953
+sa 314896
+iv 314309
+na 313457
+p_ 312143
+pe 311951
+rt 311798
+va 305550
+kt 300110
+a_ 297658
+pr 293859
+dr 284848
+rd 282063
+ru 280880
+ek 269861
+ld 265611
+pa 262130
+nn 260414
+så 259486
+sl 251562
+eu 251540
+dl 244833
+æn 234268
+hv 233615
+to 229532
+bl 229453
+ak 227826
+k_ 226988
+lt 226496
+rm 224984
+ov 224928
+dt 224192
+fø 216314
+rb 215481
+rk 213966
+rl 213405
+væ 210169
+kr 206897
+gr 205859
+da 205252
+od 200321
+Ã¥r 200023
+nk 197635
+må 195729
+ts 193376
+Ã¥d 193326
+ft 190754
+vo 187431
+gi 181827
+u_ 181053
+no 180264
+ej 179418
+ad 174777
+po 173284
+ev 171948
+ce 171597
+rg 168934
+dv 168178
+ul 167029
+mo 165132
+ie 163360
+ræ 162160
+fa 157857
+gh 153141
+tn 150745
+ku 149938
+ga 148443
+ef 146032
+sm 143722
+ks 142826
+ho 141679
+as 139699
+kl 139085
+tu 138685
+v_ 138550
+sæ 137758
+rå 137025
+ab 134963
+fi 132778
+ut 132775
+ea 131619
+æl 131177
+kn 125733
+ir 125598
+lo 123334
+_ø 123194
+av 122602
+br 121922
+lu 120021
+os 119853
+ms 119430
+Ã¥l 118310
+hr 117648
+tæ 117116
+bi 113957
+lg 113917
+ba 113423
+rh 112445
+fe 109603
+jd 108412
+dn 106943
+ød 103330
+læ 102374
+o_ 99335
+sy 98465
+_c 97926
+ci 96867
+yd 96674
+gg 96644
+us 96127
+fæ 95372
+pl 95365
+sv 93683
+im 93251
+pæ 92633
+gø 92590
+ua 92018
+rr 91890
+gl 90784
+yn 90264
+tø 88392
+nu 88073
+ty 87751
+rf 86422
+æi 86408
+mu 85531
+ug 82252
+ia 82062
+gå 82014
+pp 81931
+æg 80704
+æs 79524
+su 78980
+ff 78707
+sf 77731
+lk 77525
+nc 77082
+dg 75980
+mt 74964
+lv 73517
+du 73411
+mæ 71629
+ok 71498
+gu 70224
+do 70006
+gn 69969
+ny 69862
+mp 69618
+tl 69336
+æt 69302
+mr 69115
+ob 68368
+_Ã¥ 67989
+df 67934
+oc 67575
+bo 67316
+_æ 66843
+vn 66838
+øj 66143
+pø 65762
+rv 65311
+fl 63500
+nå 62764
+uk 62457
+bu 61783
+mf 60791
+lø 60767
+ly 60080
+nl 59994
+eh 59571
+ep 59512
+fu 58076
+sø 57841
+rø 57542
+nv 57484
+go 57259
+ys 57093
+næ 56661
+eb 56473
+dd 55817
+øg 55679
+if 55118
+pu 54905
+sn 54724
+of 54096
+øs 53786
+hø 53516
+øn 52989
+ot 52910
+Ã¥e 52290
+ky 50888
+yr 50521
+æk 50401
+yt 50129
+nø 49879
+um 49412
+ue 49276
+tå 49047
+bø 48097
+øt 48006
+kæ 47841
+æv 47838
+b_ 47031
+ch 46611
+få 45885
+yg 45145
+ml 45138
+øl 45061
+øk 43846
+ki 43319
+jo 43072
+up 43007
+pt 42552
+Ã¥b 41973
+yk 41925
+nf 41815
+fs 41629
+ic 41454
+ap 41131
+db 40423
+hu 40089
+kv 39612
+ac 39300
+ry 39053
+mh 38031
+ou 36792
+by 36770
+au 36392
+mø 36145
+lf 35654
+pi 35247
+nh 35218
+ye 35033
+hæ 35026
+æf 34930
+hi 34437
+bs 32351
+ib 32281
+hå 31799
+yl 31757
+pf 31669
+co 31259
+ip 31212
+æd 30735
+lj 30689
+sb 30619
+mb 30434
+lb 29193
+ec 29050
+mn 29008
+gæ 27612
+fg 27229
+tv 27095
+lp 26917
+sr 26535
+lå 26243
+cc 25892
+øv 25799
+th 25685
+_y 25626
+hj 25117
+nb 25057
+y_ 24988
+Ã¥s 24933
+gv 24807
+tj 24577
+dh 24514
+dy 24429
+rp 24128
+gd 24102
+uf 24079
+ca 23144
+øb 22875
+jø 22711
+ai 22698
+pm 22454
+kø 22179
+dk 21342
+sc 21210
+Ã¥n 21138
+j_ 20773
+sh 20246
+gj 20075
+vs 20040
+qu 19996
+ju 19709
+dø 19486
+vg 18966
+ps 18860
+uc 18545
+jæ 18398
+ub 17992
+jl 17586
+øm 17552
+æm 17516
+vt 17434
+ee 17408
+_w 17402
+vd 16903
+nm 16857
+tf 16828
+øf 16415
+dm 16354
+eo 16078
+ja 15969
+uv 15935
+my 15767
+vr 15745
+nr 15367
+oe 15221
+lm 15086
+ei 14593
+vl 14583
+mk 14395
+dj 14335
+gy 14263
+rc 14078
+fh 14048
+pn 13873
+sg 13857
+ym 13346
+bå 13126
+_é 12805
+ui 12744
+js 12515
+mg 12112
+vu 12052
+oj 11999
+dé 11839
+bn 11627
+c_ 11623
+lh 11453
+fy 11279
+_q 11268
+æb 11217
+ae 11205
+ih 11002
+vå 10922
+pg 10737
+oo 10560
+bæ 10453
+sd 10348
+ph 10212
+fj 10190
+é_ 9964
+Ã¥g 9807
+h_ 9512
+z_ 9436
+ey 8973
+nj 8848
+ck 8381
+yp 8345
+oi 8332
+cu 8202
+ux 8174
+Ã¥v 7888
+fv 7848
+vf 7755
+Ã¥t 7733
+øe 7664
+ét 7304
+pb 7242
+tp 7132
+bt 6982
+tk 6943
+té 6842
+wa 6699
+ée 6651
+fn 6544
+ré 6527
+iu 6307
+ez 6306
+én 6243
+hy 6184
+ér 6159
+à_ 6095
+jt 5966
+æc 5944
+xe 5841
+x_ 5608
+tm 5538
+_à5391
+ø_ 5343
+dæ 5335
+dp 5272
+iø 5191
+we 5162
+ct 4975
+Ã¥k 4952
+yb 4940
+aa 4924
+cr 4865
+oh 4830
+uo 4814
+fb 4810
+aj 4789
+då 4786
+ii 4712
+tg 4704
+wi 4599
+és 4547
+bb 4492
+lr 4458
+ex 4454
+ah 4341
+tb 4312
+zo 4270
+ij 4221
+ay 4166
+gf 4129
+mv 4082
+wt 4033
+cy 3956
+yo 3880
+jn 3809
+Ã¥p 3799
+_z 3765
+gm 3745
+uh 3738
+hl 3703
+sj 3703
+kå 3686
+oa 3606
+ow 3524
+pd 3524
+yv 3499
+jr 3419
+iq 3392
+zi 3355
+nz 3323
+ln 3287
+bj 3189
+oy 3107
+ao 3068
+fk 3030
+cl 2908
+ya 2866
+wo 2774
+ze 2721
+æe 2692
+éc 2686
+hn 2632
+za 2617
+kh 2597
+pé 2583
+mc 2557
+ht 2521
+xi 2482
+gk 2462
+hm 2422
+az 2320
+ew 2312
+vb 2260
+np 2215
+tz 2201
+mé 2190
+iz 2185
+uu 2141
+èr 2045
+w_ 2039
+kj 1963
+lé 1963
+né 1903
+ég 1891
+eø 1890
+md 1875
+ox 1867
+jk 1843
+iè 1788
+Ã¥f 1718
+sé 1697
+vm 1650
+pk 1628
+rö 1599
+zz 1571
+øp 1563
+td 1535
+cn 1511
+ál 1498
+gp 1453
+év 1437
+êt 1437
+vh 1422
+æp 1413
+él 1413
+gb 1412
+ón 1408
+km 1393
+øu 1388
+lz 1385
+uz 1375
+øo 1370
+vø 1352
+ji 1349
+cb 1313
+rè 1313
+tc 1287
+wh 1251
+ès 1237
+ör 1225
+oz 1215
+éd 1191
+cq 1190
+hw 1185
+oø 1181
+ös 1134
+ró 1127
+sw 1095
+ÃÂÂn 1090
+fp 1089
+yh 1082
+án 1074
+ws 1039
+ép 1033
+hé 1030
+ix 1023
+ém 1002
+öm 996
+zá 984
+pv 973
+nè 944
+eå 940
+py 936
+sq 936
+rz 935
+yi 916
+èv 914
+aw 908
+jö 902
+fd 899
+vé 896
+ié 883
+bö 880
+än 877
+wu 872
+èm 864
+rü 861
+xa 858
+lè 853
+cd 849
+lc 848
+uy 835
+_ê 827
+gö 809
+vk 806
+ÃÂÂa 786
+zu 780
+aæ 774
+kp 770
+rq 764
+uj 761
+öl 761
+üb 749
+ué 745
+øa 741
+hs 740
+cs 730
+bw 727
+tw 727
+rà718
+qv 717
+_x 695
+dz 693
+öt 683
+vp 676
+fé 675
+gé 674
+éf 666
+vj 648
+êm 641
+xt 637
+Ã¥h 634
+wl 628
+bé 626
+éa 621
+rw 616
+wy 613
+uq 604
+kb 601
+fm 591
+tà579
+mê 572
+zq 558
+èg 551
+xp 545
+_á 540
+øh 537
+bd 536
+xc 536
+øi 526
+mü 523
+cé 522
+kf 520
+öd 518
+pä 502
+cà499
+dq 490
+kö 490
+cm 484
+æ_ 480
+vc 478
+bh 471
+éb 468
+lq 464
+aq 462
+hö 453
+iw 451
+ön 450
+üh 450
+uø 449
+ná 434
+dw 427
+nw 420
+wm 420
+bk 399
+sá 397
+jf 394
+ül 389
+ax 385
+vv 385
+hä 377
+uæ 376
+pc 367
+sz 367
+zn 354
+éo 354
+dü 351
+éq 351
+dà349
+éj 347
+sö 345
+ça 339
+Ã¥m 335
+ün 332
+rê 325
+yu 322
+uw 321
+hd 319
+jh 318
+_ö 308
+iö 307
+är 307
+rô 302
+là301
+ó_ 299
+tê 297
+ôl 294
+má 292
+aî 290
+kd 290
+kx 290
+ÃÂÂ_ 290
+ôt 284
+dc 282
+jà279
+sò 277
+eæ 276
+òl 276
+dö 274
+q_ 270
+fä 269
+kä 268
+ún 265
+iæ 264
+öc 262
+ù_ 262
+où 259
+äm 259
+cú 258
+tè 253
+öh 248
+nq 247
+hc 246
+jg 245
+ög 243
+aç 241
+eq 240
+kg 240
+ão 240
+ÃÂÂe 238
+bv 232
+hh 230
+lö 225
+yf 224
+cf 223
+xx 219
+só 218
+fc 216
+zh 216
+ço 214
+öw 214
+öö 214
+sà209
+añ 208
+rj 204
+ît 202
+bc 198
+wn 198
+éu 194
+zf 187
+ß_ 186
+ût 185
+zs 178
+cè 177
+gü 177
+cô 174
+oq 173
+dè 172
+pö 172
+yc 172
+oû 168
+aß 166
+qa 165
+cp 164
+bm 161
+ño 157
+rç 155
+á_ 155
+æa 152
+èt 151
+pè 148
+cò 147
+ló 146
+hè 145
+ár 140
+iå 137
+nç 137
+zl 137
+ür 136
+ñe 134
+óp 134
+ò_ 132
+jb 131
+âc 130
+èd 125
+în 118
+mè 117
+aï 115
+bp 115
+pj 114
+hk 113
+tx 111
+jp 108
+lä 106
+iñ 104
+tà104
+èn 104
+jå 102
+yy 102
+zb 102
+pê 101
+nä 100
+êc 100
+äf 98
+iã 97
+vä 94
+hb 92
+jv 92
+ké 89
+là89
+hô 88
+iy 88
+tó 88
+xé 88
+äy 87
+tá 86
+wr 86
+üs 86
+äl 84
+_º 83
+xf 83
+às 83
+ió 82
+nö 81
+tô 81
+xv 81
+rx 78
+ña 78
+ö_ 78
+zr 77
+æj 77
+Ã¥z 76
+sä 74
+èl 74
+rà72
+xy 71
+º_ 71
+ä_ 71
+hü 70
+éh 70
+éi 70
+ïr 70
+cg 69
+ûr 69
+sû 67
+bf 65
+jm 64
+xh 64
+xo 64
+kc 63
+ât 63
+ôm 62
+_ó 61
+gc 61
+rã 59
+Ã¥o 59
+æu 59
+râ 58
+tâ 57
+mw 56
+yé 56
+rá 54
+çu 54
+eß 53
+lá 53
+zó 53
+ÃÂÂg 53
+hp 52
+vè 52
+ßl 52
+dû 51
+gè 51
+mã 51
+øø 51
+oå 50
+bâ 49
+eç 49
+oñ 48
+èc 47
+û_ 47
+aé 46
+cw 45
+lü 45
+Ã¥a 45
+ÃÂÂs 44
+mà43
+yj 42
+ái 42
+kw 41
+ék 41
+uà40
+æo 40
+aà39
+uè 39
+yá 39
+zk 39
+_â 38
+sè 37
+wf 37
+zc 36
+cj 35
+vy 35
+ác 35
+mó 34
+wb 34
+ôn 34
+ël 33
+uê 32
+xu 32
+hf 31
+xq 31
+öv 31
+nü 30
+oî 30
+uß 30
+yw 30
+fè 29
+lw 29
+zy 29
+éé 29
+tü 28
+vá 27
+ww 27
+üt 27
+bá 26
+jü 26
+ÃÂÂo 26
+rú 25
+vê 25
+ás 25
+wc 24
+fá 23
+fó 23
+er_ 2801629
+_de 2154972
+en_ 1795246
+et_ 1711315
+for 1388382
+_fo 1228769
+de_ 1086123
+der 895079
+at_ 879512
+det 858881
+_og 849053
+_at 829126
+ing 822586
+den 795123
+og_ 769881
+nde 745120
+_me 720743
+_i_ 694315
+_vi 674286
+or_ 661059
+om_ 658564
+re_ 627078
+il_ 621896
+_af 615112
+til 606980
+_ti 599883
+_er 599237
+ke_ 591439
+ere 569065
+ne_ 561901
+_en 550123
+lig 533188
+ed_ 505607
+ge_ 503065
+af_ 503001
+ter 502040
+and 499183
+es_ 493875
+ger 457428
+lle 456402
+_be 453497
+nin 440336
+ion 431766
+ng_ 425519
+nge 423562
+kke 418822
+te_ 418591
+els 403667
+ske 399735
+end 399044
+som 395122
+_ha 395077
+men 391282
+med 390502
+le_ 378257
+lse 377718
+_om 375212
+_so 373496
+tte 369371
+_ko 368302
+gen 367900
+ede 359737
+ind 359459
+_st 358199
+ige 355577
+_in 347804
+se_ 346458
+ern 345429
+ar_ 344326
+ste 340819
+ikk 330914
+_på 329691
+ig_ 327922
+rne 312151
+på_ 308470
+isk 306667
+ver 305397
+ent 304909
+_ud 294966
+_je 294121
+an_ 292375
+vi_ 292015
+_si 291861
+_fr 291701
+eg_ 287674
+jeg 286749
+age 285972
+del 282277
+har 274906
+_re 273174
+igt 269137
+ler 268435
+ret 266543
+_ik 263910
+vil 262538
+_p_ 260415
+mme 258373
+res 257379
+man 256306
+hed 252326
+ker 249303
+one 246724
+lan 245419
+rin 244298
+nne 243957
+gt_ 243052
+_sk 238328
+ska 237723
+_eu 232344
+kom 228773
+nte 228140
+_an 220239
+get 218103
+_hv 217842
+nd_ 214299
+omm 213510
+tio 213072
+_he 213021
+ser 212966
+und 211801
+iss 210633
+ang 208269
+ame 207817
+ens 206498
+_mi 204747
+_et 203819
+ati 203635
+tet 203062
+ner 201612
+så_ 198050
+ene 197361
+_ve 196035
+_pr 195100
+ors 194242
+_ma 193164
+sta 193129
+_la 192225
+_sp 191558
+ive 191021
+mis 189476
+øre 189141
+ell 187644
+ett 186324
+orm 185995
+nen 184567
+_sa 183341
+enn 183251
+eur 182170
+me_ 180941
+uro 180152
+ren 179631
+_al 178507
+mer 175748
+ord 173894
+ore 171996
+rer 170665
+al_ 170441
+lem 170184
+ære 168552
+rop 167626
+ove 167217
+sig 167194
+_ka 167046
+vær 164734
+tig 164639
+ale 163356
+Ã¥r_ 163283
+kon 161833
+pro 161026
+eli 160125
+ans 159823
+eri 159566
+_op 159556
+vis 158957
+_un 157909
+før 154957
+_na 153905
+_pa 153833
+kan 151750
+vor 151588
+tal 151512
+ngs 150811
+ssi 149482
+ghe 148694
+igh 147314
+str 147247
+sen 147100
+_bl 147055
+lag 146559
+id_ 145577
+Ã¥de 145204
+bet 144290
+em_ 143959
+iti 143922
+lin 142951
+kal 142860
+ege 142785
+ndr 142494
+dle 142477
+ag_ 142171
+tni 140580
+sio 140444
+ill 140091
+ved 139938
+dig 139931
+_væ 139897
+mmi 138179
+par 137052
+dre 136807
+rbe 136306
+_ge 135657
+_så 134445
+red 134151
+ide 134127
+est 133647
+on_ 133072
+bes 132739
+rma 131765
+_ov 131542
+spe 131458
+ve_ 131150
+_se 130306
+sam 129917
+råd 129583
+fre 129515
+tag 129210
+ven 128571
+ns_ 128393
+lit 128289
+han 126426
+lde 125124
+tat 123892
+_tr 122770
+ers 122571
+sse 122007
+sla 121028
+nes 120941
+ten 120885
+var 120386
+_di 118780
+is_ 117728
+_må 116841
+_gr 116742
+st_ 116447
+min 116367
+_ta 116166
+ogs 115999
+ate 115980
+gså 115222
+ndl 114761
+rt_ 114263
+rla 114238
+hr_ 113786
+dt_ 113611
+kel 113573
+_hr 113483
+rem 112458
+des 112306
+ort 112258
+kni 111764
+_id 111227
+fra 111201
+all 109101
+arl 109101
+old 108954
+ekt 108318
+oli 108259
+tra 107710
+kti 107651
+tid 107130
+rke 106588
+fte 105874
+el_ 105774
+arb 105480
+ble 105386
+tis 105042
+udv 104905
+ejd 104763
+ist 104571
+_fø 104296
+bej 104168
+sti 103923
+tiv 102669
+ra_ 101738
+lam 101160
+_va 100794
+gel 100592
+_no 100566
+rde 100507
+lt_ 100389
+alt 100040
+sk_ 99715
+hol 98526
+tem 98006
+nsk 97210
+pol 96575
+rst 95739
+reg 95680
+rsl 94995
+orb 94113
+nam 93385
+eak 93332
+_fa 93329
+emm 92770
+ake 92314
+gør 92169
+tor 91521
+gru 91379
+les 91342
+mål 91029
+pea 90616
+mod 89812
+ænd 89433
+_fi 88858
+opæ 88847
+_li 88793
+_ar 88341
+_da 88281
+bli 88096
+ets 87668
+ts_ 87279
+_po 86769
+æis 86378
+kab 86361
+pæi 86263
+_ku 86223
+dis 85299
+val 84723
+ems 84644
+rli 84629
+art 84437
+_mo 84341
+nst 84268
+mel 83901
+hen 83325
+gge 83113
+hvi 83058
+amm 82624
+ndi 82311
+gan 81998
+ber 81380
+esk 81355
+sto 81317
+tæn 80665
+lev 80374
+giv 80123
+ele 79928
+dri 78705
+tik 78594
+hvo 78332
+dem 78279
+kri 78213
+ken 78204
+nds 77915
+elt 77535
+ite 77514
+lut 77404
+akt 77123
+ise 77047
+edl 76907
+lli 76864
+lge 76670
+_vo 76327
+ør_ 75882
+dst 75113
+_ef 74781
+_el 74496
+jde 74479
+stø 74372
+eks 74206
+dvi 74205
+her 73875
+gti 73853
+are 73584
+nat 73535
+nem 73156
+fæl 73135
+nt_ 73005
+kun 72983
+ran 72809
+nog 72531
+vet 72084
+opa 71920
+yde 71914
+ørg 71880
+rig 71646
+ons 71405
+rel 71375
+sid 71238
+eds 71096
+ænk 70862
+mar 70681
+fin 70677
+led 70620
+_kr 70517
+ess 70295
+gsm 70135
+rat 70133
+liv 69920
+sik 69601
+bru 69398
+ad_ 69304
+_rå 69293
+sær 69283
+vid 69027
+nal 68964
+int 68851
+tel 68665
+ffe 68036
+små 67959
+dni 67477
+tre 66900
+rre 66867
+run 65689
+spø 65677
+per 65660
+pør 65496
+sst 65353
+sel 64834
+dli 64583
+rti 64582
+hel 64266
+ppe 64265
+ert 64244
+ris 63652
+_fæ 63438
+_ne 63399
+pa_ 63381
+slu 63222
+rug 62735
+sæt 62604
+mul 62505
+ik_ 62465
+kte 62327
+os_ 61982
+sfo 61967
+in_ 61671
+erf 61572
+nu_ 61461
+sat 61324
+meg 61278
+etæ 61214
+eft 60868
+eve 60861
+orh 60626
+dan 60563
+uni 60181
+alg 59850
+rdi 59617
+rfo 59553
+Ã¥l_ 59373
+tro 59365
+rgs 59345
+gle 59336
+kla 59165
+rsk 59161
+eu_ 59061
+æll 58900
+agt 58798
+_or 58769
+att 58673
+let 58479
+nis 58446
+_br 58411
+esl 58335
+tan 58206
+_gø 58093
+tur 58088
+_mu 57959
+od_ 57651
+len 57497
+uli 57202
+syn 57042
+ona 56932
+org 56780
+må_ 56471
+kt_ 56402
+nkn 56104
+hav 56051
+ali 55755
+ærk 55600
+nse 55291
+_ga 55024
+_le 54996
+pri 54945
+ørs 54921
+tli 54693
+dag 54627
+rge 54460
+abe 54278
+ude 53820
+_æn 53633
+ndt 53557
+ave 53371
+mrå 53334
+vir 53317
+omr 53199
+læg 53181
+ld_ 53149
+gra 53018
+sag 52970
+_Ã¥r 52937
+gte 52685
+irk 52667
+_nu 52561
+eme 52369
+dva 52220
+nkt 52195
+ast 51953
+kra 51909
+ine 51799
+træ 51477
+ant 51388
+_ny 51245
+ket 51067
+sva 51025
+_os 50795
+elv 50409
+jer 50380
+omi 50366
+nce 50292
+_to 50037
+oge 50036
+ram 49549
+ætt 49505
+oll 49392
+gua 49266
+_ho 49163
+aft 48892
+ngu 48875
+ier 48850
+vig 48654
+nio 48610
+_ek 48606
+mil 48491
+uag 48477
+_kl 48450
+ien 48039
+_gi 47996
+nsi 47960
+unk 47960
+_nå 47885
+lad 47772
+edr 47765
+sit 47605
+tøt 47500
+øtt 47413
+øde 47168
+dfø 47151
+gsf 47088
+stå 47054
+æld 46906
+udg 46547
+mid 46516
+dta 46501
+bed 46355
+_pe 46283
+_bø 46261
+ode 46153
+_nø 45959
+_få 45872
+erh 45831
+ges 45712
+net 45690
+rag 45648
+tti 45527
+_ba 45474
+rte 45235
+skr 45191
+itu 45134
+ted 44855
+eni 44831
+æng 44804
+ids 44762
+_næ 44737
+bør 44719
+beh 44677
+ire 44656
+rek 44602
+_fl 44367
+ono 44345
+sin 44191
+nve 44190
+_sy 44167
+Ã¥le 44126
+ikl 44073
+ald 44020
+rit 43980
+_go 43923
+pun 43915
+ina 43882
+spo 43702
+nom 43698
+un_ 43659
+lar 43641
+idl 43561
+rme 43549
+ked 43400
+_te 43390
+går 43389
+_bi 43348
+vik 43313
+ntr 43312
+kre 43184
+øko 43158
+sni 43012
+føl 42955
+ær_ 42325
+øge 42311
+_bo 42285
+nød 41871
+bin 41851
+god 41842
+ytt 41734
+ure 41705
+ud_ 41565
+_bu 41513
+egi 41479
+mss 41436
+_lo 41433
+rak 41326
+ial 41304
+søg 41297
+van 41281
+idt 41256
+obl 41235
+lke 41199
+ukt 41127
+ses 41063
+afs 40771
+ont 40747
+øje 40604
+ini 40356
+dsk 40332
+nta 40265
+ins 40127
+rbi 40092
+_sæ 40042
+utn 39884
+ntl 39879
+ori 39830
+_øk 39746
+por 39554
+nke 39528
+tyd 39441
+når 39404
+pla 39201
+_hø 39173
+ark 38829
+iv_ 38698
+rob 38696
+ærd 38640
+ægg 38524
+rks 38403
+spr 38325
+vad 38174
+beg 38155
+met 38000
+hva 37894
+kli 37877
+øns 37764
+tru 37729
+_do 37635
+mig 37548
+lov 37454
+emt 37442
+fru 37338
+_im 37320
+erv 37257
+pe_ 37257
+_ra 37255
+fat 37090
+upp 37079
+dve 36877
+ete 36853
+mpe 36831
+bud 36777
+bek 36686
+_dr 36647
+ræn 36544
+ror 36477
+tri 36410
+sky 36403
+mær 36358
+rod 36318
+ils 36260
+rol 36239
+_fu 36176
+ølg 36149
+bor 36108
+to_ 35764
+rs_ 35634
+edt 35580
+uge 35502
+ru_ 35340
+ned 35212
+unn 35195
+cen 35134
+ora 35058
+vel 34909
+rup 34869
+lis 34808
+kol 34800
+eje 34796
+nli 34576
+ade 34524
+dir 34496
+rie 34486
+sku 34462
+rog 34430
+ilk 34350
+ækk 34285
+hve 34263
+cer 33905
+eta 33843
+fri 33722
+tin 33698
+ræk 33683
+ult 33673
+_of 33451
+efo 33287
+evi 33119
+op_ 33077
+olk 33072
+enh 33053
+_gå 33023
+jds 32978
+_sv 32957
+raf 32930
+bev 32926
+løs 32888
+leg 32882
+_hu 32839
+rid 32834
+ødv 32754
+tes 32681
+era 32651
+kso 32615
+_lø 32598
+ev_ 32563
+it_ 32552
+ral 32411
+igg 32378
+tyr 32356
+gne 32134
+Ã¥be 32117
+_pl 32087
+rho 32058
+teg 31941
+enc 31895
+roc 31894
+_su 31765
+je_ 31761
+fol 31731
+bel 31723
+idi 31540
+mst 31502
+drø 31491
+opf 31486
+nel 31420
+lta 31359
+pen 31332
+_læ 31239
+nti 31171
+jen 31120
+mt_ 31035
+_øn 31029
+lik 30994
+sek 30879
+præ 30860
+_ri 30802
+oce 30665
+uds 30504
+erl 30448
+ogr 30318
+oci 30312
+soc 30310
+fle 30272
+di_ 30247
+ogl 30225
+ani 30074
+ane 30028
+rhe 29987
+mød 29974
+rts 29928
+tør 29910
+fas 29868
+egr 29830
+da_ 29801
+udt 29778
+fer 29694
+sis 29648
+gsp 29603
+dsp 29565
+uti 29558
+cia 29532
+vin 29488
+ari 29455
+ikr 29409
+rha 29405
+egn 29381
+ynd 29373
+ety 29339
+nan 29258
+emo 29228
+erd 29070
+nsy 29061
+nye 29043
+fun 28963
+ama 28853
+græ 28767
+dra 28721
+tak 28719
+dde 28666
+rsø 28649
+sme 28617
+onk 28575
+ika 28540
+yn_ 28537
+ben 28502
+Ã¥et 28314
+omh 28237
+ili 28223
+ilf 28220
+off 28068
+atu 27981
+ann 27801
+fal 27784
+ssæ 27741
+ltn 27737
+lv_ 27653
+kræ 27557
+fta 27482
+emf 27410
+_ty 27364
+nit 27351
+etn 27350
+bil 27285
+son 27234
+afg 27163
+mti 27144
+esu 27104
+eml 27095
+_pu 27042
+erk 27041
+kul 27033
+ilj 27005
+mfø 26950
+adi 26914
+eng 26868
+err 26807
+eha 26804
+rve 26774
+_kv 26767
+odu 26672
+tit 26623
+_hå 26594
+sty 26554
+nsp 26511
+ye_ 26476
+sor 26458
+dsa 26356
+høj 26334
+æde 26317
+ful 26290
+ce_ 26288
+kat 26220
+_gl 26123
+æse 26100
+ats 26093
+pre 26088
+rdn 25833
+æve 25698
+amt 25693
+rso 25606
+få_ 25598
+yst 25597
+log 25539
+vej 25528
+fti 25470
+uld 25451
+ørt 25436
+tek 25424
+emn 25423
+lid 25396
+tab 25361
+eho 25286
+odt 25238
+oms 25169
+bef 25048
+_s_ 24979
+iel 24966
+ds_ 24910
+æst 24908
+dge 24894
+æft 24872
+rør 24835
+mhe 24780
+stæ 24755
+mli 24725
+såd 24711
+Ã¥da 24708
+ssk 24518
+_ak 24491
+ks_ 24470
+måd 24464
+æns 24450
+bag 24431
+imi 24431
+igs 24386
+top 24222
+tær 24211
+tje 24191
+mat 24114
+yrk 24061
+gni 24039
+gæl 24031
+ass 24019
+ab_ 23971
+utt 23856
+okr 23766
+hør 23686
+_sl 23655
+ivi 23649
+skæ 23611
+rna 23596
+kst 23541
+ank 23521
+anv 23499
+ndb 23492
+sie 23426
+ldt 23419
+uat 23414
+_is 23388
+_ad 23384
+rga 23366
+jor 23354
+dar 23285
+_co 23262
+rej 23214
+tua 23214
+dom 23118
+igv 23024
+anl 22965
+mok 22936
+vne 22930
+mes 22909
+_eg 22902
+hov 22885
+ndn 22824
+tår 22803
+orv 22763
+ktu 22754
+tut 22727
+dbr 22594
+san 22581
+am_ 22444
+ces 22428
+set 22410
+duk 22398
+lst 22377
+opm 22305
+lys 22285
+pek 22234
+orl 22102
+dnu 22087
+eto 22067
+erg 22055
+rad 21987
+cce 21941
+_yd 21894
+gvi 21885
+slå 21883
+ves 21873
+ept 21872
+lte 21807
+nyt 21807
+ræs 21772
+pas 21758
+yld 21678
+ærl 21650
+ljø 21645
+ift 21587
+lba 21587
+ykk 21553
+_ro 21507
+pli 21480
+_hi 21461
+fen 21460
+ara 21430
+ksi 21355
+kor 21302
+pos 21203
+be_ 21154
+abs 21124
+sål 21093
+ref 20984
+esp 20927
+eva 20901
+try 20847
+_for 1202648
+_at_ 821942
+_og_ 733825
+det_ 729520
+_det 673352
+der_ 628358
+den_ 575859
+for_ 571050
+_er_ 568997
+_til 538024
+_af_ 494316
+_den 467403
+_der 448022
+ning 438126
+til_ 433520
+_de_ 395856
+_en_ 386989
+ing_ 373949
+else 373350
+_med 369922
+som_ 350408
+ikke 330808
+_som 329558
+inge 310538
+erne 305607
+_på_ 304814
+kke_ 302032
+_vi_ 291823
+_jeg 286697
+jeg_ 286630
+_om_ 286120
+med_ 281800
+ende 278736
+nde_ 278506
+rne_ 268477
+_har 265528
+_ikk 262940
+ske_ 261428
+har_ 259218
+ige_ 246133
+ter_ 246016
+ger_ 239812
+ere_ 235208
+ione 227570
+_vil 215985
+tion 212570
+ring 211285
+_kom 204827
+lse_ 202147
+iske 201853
+komm 195929
+tte_ 194572
+_ind 194299
+_et_ 193143
+get_ 191845
+gen_ 191751
+fors 189124
+_men 189092
+igt_ 182592
+enne 181580
+lige 181123
+nger 178810
+vil_ 177548
+euro 177256
+form 176019
+lle_ 175989
+_eur 172943
+ker_ 169267
+ande 165698
+urop 163107
+res_ 162341
+elle 161813
+_ska 160402
+inde 159985
+ler_ 156812
+tet_ 154999
+ver_ 154492
+elig 150975
+ette 150192
+nder 149880
+onen 149283
+ghed 147813
+_lan 147499
+ngen 146688
+ighe 146495
+ede_ 144035
+over 141973
+ment 141101
+sion 140212
+tnin 138814
+miss 138606
+nen_ 137773
+nne_ 137460
+ente 136957
+land 136040
+men_ 134829
+_kan 134514
+ommi 134425
+mmis 134379
+ings 133853
+atio 132445
+kan_ 132218
+_ove 131450
+ser_ 129358
+and_ 127731
+orma 126376
+_man 126231
+lig_ 126068
+_sig 125722
+nden 124669
+dels 124585
+kal_ 124398
+skal 124313
+_par 123784
+ling 123694
+_ved 123291
+tage 122454
+rer_ 122037
+mand 121422
+ner_ 120895
+ret_ 118625
+ssio 117712
+_sam 117476
+_bes 116348
+rman 115257
+_ogs 115160
+også 115160
+gså_ 115159
+være 114859
+_fre 114494
+ller 114140
+_hr_ 113480
+_pro 112954
+_vær 112644
+ion_ 111906
+_bet 111474
+ste_ 111427
+hed_ 110792
+issi 110436
+age_ 109940
+unde 109472
+hede 109455
+råde 106834
+_kon 106396
+frem 105839
+_fra 105654
+eder 104951
+arbe 104199
+rbej 104144
+bejd 104142
+knin 104135
+ndel 104087
+ligt 103028
+ale_ 102605
+gern 101187
+_spe 100047
+amen 99971
+ære_ 99800
+slag 99680
+dett 99575
+nter 98974
+lame 97203
+_all 96846
+alle 96623
+parl 96513
+denn 96106
+arla 95632
+erin 95418
+rlam 95412
+hold 94660
+_id_ 94149
+fra_ 94131
+_und 93500
+mer_ 93323
+tere 92953
+rsla 92873
+tisk 92838
+eres 92836
+ens_ 92468
+orsl 91597
+name 91346
+isk_ 91275
+poli 91137
+ame_ 90966
+forb 90898
+liti 90597
+hand 90519
+olit 90505
+aker 90204
+_nam 90134
+spea 90059
+peak 90053
+eake 90025
+sen_ 89551
+emme 89012
+stem 88904
+_udv 88753
+ropæ 88550
+ntet 88276
+vis_ 87807
+lag_ 87654
+des_ 87582
+dere 87437
+_gen 87415
+dre_ 87149
+pæis 86261
+opæi 86259
+æisk 86244
+skab 85291
+_min 84960
+ndre 83213
+tern 82745
+stat 82647
+_hvi 82288
+amme 82168
+rlig 82034
+ten_ 81959
+_and 80113
+rede 79314
+tate 79210
+føre 79061
+oner 78681
+ille 78473
+_hvo 78332
+hvor 78331
+sig_ 78238
+nske 78092
+lser 77968
+sse_ 77340
+ved_ 76976
+fter 76922
+_hen 76760
+ores 76283
+_ret 76154
+man_ 75530
+andl 75118
+ater 74946
+tale 74833
+eret 74822
+edle 74650
+_så_ 74526
+ene_ 74326
+dlem 74283
+_end 74271
+medl 74069
+_gru 73947
+gtig 73433
+mmer 72783
+ive_ 72531
+_kun 71982
+_nog 71974
+omme 71905
+_dem 71791
+este 71733
+_dis 71561
+ropa 71292
+lang 71260
+ejde 71170
+sker 71068
+mme_ 70183
+vend 70111
+_her 70084
+_sta 69694
+gere 69656
+fore 69580
+iver 69015
+nge_ 68691
+_før 68223
+_råd 68214
+isse 68123
+gels 67893
+øre_ 67713
+eget 67623
+_stø 67490
+vet_ 67471
+dnin 67435
+lsen 66695
+gøre 66590
+drin 66305
+rett 66222
+tænk 65712
+spør 65494
+pørg 65491
+rund 65422
+inte 65299
+_reg 65019
+Ã¥det 64758
+ets_ 64202
+_int 63916
+ndig 63795
+lles 63286
+opa_ 63112
+live 63058
+slut 62586
+ener 62392
+_vor 62232
+till 61838
+give 61765
+igti 61709
+_hel 61607
+ktiv 61440
+lere 61271
+_arb 61143
+_meg 61101
+udvi 61065
+var_ 61002
+mege 60979
+brug 60741
+efte 60579
+rend 60391
+itet 59917
+les_ 59876
+forh 59838
+_han 59629
+gsmå 59392
+sfor 59288
+mål_ 59168
+_ell 59164
+ster 59116
+ælle 58768
+ørgs 58667
+vore 58464
+_eu_ 58308
+bliv 58264
+_pol 58016
+_spø 57949
+_gør 57922
+lede 57885
+_bli 57650
+smål 57559
+blev 57345
+grun 57312
+ligh 57197
+_ble 57173
+_fin 56919
+diss 56650
+rgsm 56565
+etæn 56344
+betæ 56266
+nkni 56030
+ænkn 56015
+ford 55935
+_eft 55926
+eren 55816
+fæll 55816
+ændr 55796
+rfor 55764
+valg 55601
+Ã¥de_ 55582
+_fæl 55359
+stor 55194
+itik 54944
+ange 54746
+ndri 54646
+kker 54262
+nes_ 54192
+ulig 54098
+tlig 53904
+sige 53883
+_mod 53819
+_sid 53762
+_var 53563
+_sto 53474
+_ænd 53414
+mråd 53333
+elt_ 53127
+tels 53032
+gang 53011
+onal 52874
+iser 52806
+muli 52708
+ered 52644
+lems 52575
+områ 52569
+iden 51997
+_mul 51933
+ager 51682
+ørst 51355
+deli 51178
+tige 50895
+virk 50830
+mmen 50732
+ører 50390
+atte 50294
+let_ 50195
+iona 50167
+nnem 50143
+_sik 50137
+nati 50029
+genn 49728
+mere 49665
+keli 49664
+_uni 49605
+hvis 49577
+dem_ 49508
+ætte 49498
+lem_ 49331
+_må_ 49284
+_sel 49225
+aget 48705
+_eks 48472
+nion 48384
+angu 48369
+ngua 48323
+gend 48316
+guag 48300
+uage 48300
+dlin 48280
+unio 47959
+ndli 47950
+ket_ 47878
+støt 47500
+tter 47496
+ent_ 47465
+_os_ 47413
+tøtt 47407
+øtte 47407
+stil 47345
+unkt 47302
+svar 47161
+erfo 46898
+_hav 46879
+vide 46850
+_ste 46835
+sætt 46734
+ekti 46618
+jde_ 46445
+ort_ 46407
+kabe 46359
+mang 46340
+selv 46211
+vor_ 45883
+illi 45857
+førs 45605
+dfør 45479
+ngsf 45376
+rati 45360
+olle 45327
+ssta 45277
+_del 45171
+samm 45025
+derf 44989
+kter 44855
+_tid 44782
+orde 44769
+ang_ 44742
+_nat 44612
+eger 44538
+vigt 44520
+rans 44426
+_lig 44339
+_bør 44259
+_vig 44177
+besk 44130
+leve 44052
+itis 43952
+skel 43947
+mod_ 43875
+alt_ 43806
+ders 43786
+_ger 43678
+_dag 43652
+mell 43594
+punk 43541
+andr 43508
+kend 43356
+ttel 43189
+ndet 43185
+_giv 43151
+dig_ 42982
+vikl 42952
+går_ 42734
+llem 42625
+ttig 42299
+gsfo 42268
+noge 42265
+_mel 42112
+olde 42041
+hens 41820
+dvik 41817
+_mil 41612
+_ord 41559
+dene 41397
+tid_ 41376
+_ude 41357
+tive 41332
+rden 41253
+ren_ 41239
+dler 41102
+temm 41061
+onom 41010
+_vir 40922
+msst 40922
+stan 40905
+nomi 40807
+_alt 40785
+uden 40766
+tigt 40732
+ansk 40718
+emss 40566
+iger 40539
+_god 40440
+_mer 40439
+udva 40138
+rege 40133
+_tag 40126
+økon 40119
+_tra 40114
+kono 40012
+utni 39881
+lutn 39880
+vare 39875
+ælde 39783
+dval 39708
+_øko 39689
+ntli 39587
+entl 39576
+her_ 39575
+bind 39506
+_nød 39458
+når_ 39401
+ytte 39367
+besl 39068
+_nu_ 39042
+vill 38992
+tigh 38989
+ber_ 38971
+klar 38966
+_afs 38932
+iste 38919
+ions 38886
+side 38755
+eslu 38658
+erer 38581
+orbi 38450
+_str 38429
+ægge 38429
+akti 38289
+lægg 38284
+eden 38108
+oble 38002
+_pri 37957
+_tal 37894
+_hva 37873
+hvad 37833
+vad_ 37824
+lder 37817
+tik_ 37752
+robl 37530
+_res 37482
+lde_ 37420
+_vis 37394
+rbin 37378
+prob 37245
+orsk 37221
+edes 37101
+ave_ 37088
+rste 36970
+indr 36936
+_fru 36891
+blem 36810
+_når 36741
+digh 36592
+rekt 36563
+mind 36561
+_sag 36344
+bør_ 36223
+port 36119
+find 36075
+ien_ 36072
+tore 36061
+omis 36038
+ønsk 36013
+dtag 35986
+nale 35930
+_kla 35895
+nens 35810
+best 35690
+følg 35650
+snin 35647
+_omr 35602
+rels 35535
+nnes 35527
+endi 35447
+_bek 35265
+ges_ 35225
+kun_ 35096
+talt 35033
+fru_ 35020
+unne 34989
+eske 34929
+sær_ 34903
+nsta 34900
+klin 34881
+stra 34811
+ølge 34809
+alge 34703
+_mar 34673
+_beg 34596
+mærk 34521
+nlig 34406
+kunn 34324
+ndle 34315
+enes 34280
+del_ 34277
+ække 34276
+inds 34266
+nven 34201
+llig 34047
+rere 33997
+_Ã¥r_ 33986
+lage 33966
+leme 33964
+_mig 33954
+skri 33895
+sted 33801
+idt_ 33795
+etti 33790
+dern 33716
+orge 33688
+ramm 33512
+dele 33470
+uppe 33455
+ikli 33422
+dire 33415
+dven 33375
+mark 33363
+dag_ 33350
+menn 33322
+misk 33253
+nesk 33252
+rupp 33227
+_ans 33201
+mig_ 33192
+grup 33188
+prog 32985
+sikk 32959
+ejds 32755
+irek 32694
+lget 32626
+fort 32589
+nødv 32565
+_beh 32523
+ødve 32508
+ksom 32113
+tils 32111
+tand 32096
+tiv_ 31995
+rkso 31987
+nkt_ 31980
+rnes 31900
+rske 31887
+len_ 31871
+agt_ 31836
+evet 31834
+_gan 31736
+_vid 31706
+ordi 31703
+midl 31506
+vilk 31450
+rked 31406
+dan_ 31272
+sere 31210
+mmel 31172
+have 31144
+idle 31118
+_opf 31097
+ress 31075
+geri 31069
+hver 31031
+_øns 31000
+proc 30987
+arke 30887
+lev_ 30764
+ence 30740
+_sti 30646
+yder 30590
+roce 30513
+kont 30509
+heds 30504
+tede 30485
+mene 30479
+sigt 30474
+ktio 30470
+rger 30409
+søge 30292
+esse 30277
+hvil 30210
+gle_ 30111
+inst 30110
+_bor 30043
+soci 30041
+dens 30020
+_bed 29935
+ligg 29876
+ilke 29866
+und_ 29783
+_bru 29733
+ogra 29716
+vent 29685
+fatt 29668
+_ud_ 29511
+lses 29491
+nogl 29491
+ogle 29488
+min_ 29427
+folk 29321
+stri 29311
+ttet 29253
+etyd 29165
+old_ 29164
+agen 29130
+_hol 29102
+_kri 29071
+dste 28872
+nsyn 28868
+møde 28787
+rhol 28778
+_ins 28768
+orha 28735
+cial 28724
+stre 28646
+ken_ 28642
+_fle 28632
+_dir 28569
+_tro 28484
+bety 28414
+syn_ 28401
+rhed 28377
+tets 28363
+ands 28344
+_fas 28323
+rhan 28306
+Ã¥et_ 28305
+prod 28299
+gene 28253
+_sit 28243
+spro 28164
+_soc 28160
+rækk 28156
+ørel 28103
+ensy 28099
+fora 28090
+nest 28062
+are_ 28039
+konk 28036
+sikr 27982
+tilf 27931
+_lov 27841
+_sin 27825
+bedr 27805
+ele_ 27744
+ruge 27703
+ltni 27692
+issæ 27680
+aler 27670
+ocia 27629
+ssær 27582
+ggen 27470
+borg 27459
+altn 27441
+_føl 27435
+rakt 27425
+ativ 27353
+art_ 27324
+teri 27320
+afta 27309
+rogr 27180
+mtid 27088
+digt 27052
+ftal 26951
+mfør 26939
+emfø 26936
+gram 26841
+etni 26783
+elv_ 26775
+koll 26759
+lite 26733
+_per 26731
+_udt 26703
+oran 26663
+ider 26661
+rdi_ 26655
+ekte 26650
+nsti 26633
+nere 26630
+met_ 26605
+rsøg 26573
+ndes 26525
+rodu 26412
+dige 26400
+ænge 26397
+stru 26383
+_nye 26301
+erhe 26282
+tes_ 26188
+inan 26164
+tten 26081
+nye_ 25904
+krat 25875
+ers_ 25844
+sat_ 25839
+_sær 25791
+fast 25772
+idst 25755
+kere 25704
+ordn 25697
+undl 25678
+irke 25649
+tyde 25608
+_få_ 25598
+ore_ 25559
+plan 25506
+_bud 25486
+ide_ 25470
+nemf 25422
+end_ 25418
+gør_ 25400
+ftig 25345
+retn 25340
+offe 25279
+demo 25238
+sent 25234
+mels 25209
+ærdi 25152
+igel 25041
+kerh 24954
+renc 24932
+ndsk 24901
+_tak 24880
+budg 24871
+drag 24794
+ydel 24780
+udge 24779
+dget 24776
+_tre 24753
+atis 24714
+såda 24708
+Ã¥dan 24707
+_såd 24697
+_pun 24630
+ivet 24593
+ehan 24587
+ndt_ 24585
+sama 24572
+marb 24565
+oget 24510
+igge 24479
+amar 24468
+vise 24443
+enta 24419
+mhed 24404
+måde 24402
+prin 24386
+tor_ 24311
+beha 24303
+blik 24292
+omhe 24284
+æret 24281
+somh 24271
+_des 24247
+ensi 24246
+_mål 24237
+græn 24221
+ræns 24221
+dets 24205
+_aft 24154
+_kol 24149
+ine_ 24141
+_høj 24072
+regi 24041
+gæld 24012
+fuld 23936
+lemm 23903
+ier_ 23853
+erst 23837
+vedt 23730
+_afg 23727
+cent 23721
+æsen 23712
+jer_ 23682
+anst 23652
+_ene 23640
+erso 23639
+utio 23637
+orme 23628
+okra 23627
+rems 23580
+gnin 23565
+ikre 23489
+sska 23481
+est_ 23389
+ppe_ 23319
+samt 23311
+stal 23272
+ontr 23208
+agel 23192
+kons 23154
+rre_ 23143
+utte 23100
+_bev 23092
+_ang 23034
+uati 23033
+dend 23015
+itua 22989
+situ 22977
+lleg 22952
+tuat 22925
+emok 22888
+mokr 22887
+lade 22840
+_akt 22832
+styr 22821
+_pla 22820
+øren 22820
+less 22815
+rgan 22811
+essk 22775
+anve 22747
+fina 22648
+emer 22628
+_van 22593
+_fri 22528
+æren 22524
+Ã¥der 22504
+tår_ 22478
+orts 22470
+arti 22468
+nans 22465
+tyrk 22443
+stør 22397
+_to_ 22391
+står 22383
+_anv 22356
+ogen 22348
+sten 22348
+orbe 22305
+rage 22271
+erti 22264
+part 22249
+erna 22246
+trak 22238
+yste 22145
+kell 22107
+_ver 22103
+kede 22099
+endn 22086
+ndnu 22085
+dnu_ 22084
+spek 22072
+kab_ 22069
+alis 22068
+rite 22024
+måle 21933
+rdni 21887
+verv 21867
+gvis 21862
+igvi 21843
+tide 21838
+stit 21822
+_val 21807
+dukt 21800
+dvid 21735
+titu 21682
+milj 21643
+iljø 21641
+fler 21626
+sids 21625
+fald 21576
+sern 21549
+edta 21543
+ykke 21538
+orho 21536
+ærli 21525
+rnat 21491
+_da_ 21480
+_off 21426
+lert 21378
+atur 21349
+egne 21333
+set_ 21305
+elli 21292
+pekt 21268
+trol 21248
+tjen 21185
+rst_ 21108
+ænse 21102
+enin 21094
+_sål 21090
+Ã¥led 21072
+nist 21047
+såle 21040
+itut 21037
+_måd 20968
+remm 20953
+edre 20940
+igte 20924
+helt 20902
+verd 20887
+spor 20832
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/sv.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/sv.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/sv.ngp (working copy)
@@ -1,1002 +1,3060 @@
-# NgramProfile generated at Sat Sep 25 16:08:58 EEST 2004 for Nutch Language Identification
-ngram_count 17884623
-_ 1097629
-e 625231
-t 581710
-a 577159
-r 525387
-n 505431
-i 371633
-s 368337
-l 308274
-o 265754
-d 264862
-m 238982
-g 202746
-k 190525
-t_ 186686
-r_ 178127
-a_ 148696
-de 143710
-v 141899
-n_ 140993
-en 139307
-f 137224
-ä 127234
-er 123487
-et 109647
-p 105560
-u 102720
-ö 102654
-h 101255
-Ã¥ 95251
-tt 91718
-in 84705
-e_ 84657
-an 84605
-ar 80781
-at 76909
-om 76165
-en_ 74255
-te 74039
-ör 72816
-ll 70942
-ra 67329
-c 67293
-b 65581
-et_ 65521
-fö 63006
-tt_ 62645
-ti 62583
-för 61570
-st 60979
-er_ 57801
-m_ 57375
-nd 57260
-ta 54965
-att 50169
-me 49729
-sk 49209
-s_ 49034
-ka 48340
-g_ 47894
-na 47169
-is 46611
-re 45900
-är 45800
-ng 44616
-oc 43886
-la 43758
-li 43331
-det 42846
-ig 41214
-vi 40980
-on 40736
-j 40031
-ns 38455
-il 37479
-l_ 36592
-ch 36390
-al 35944
-ar_ 35734
-nt 35642
-ga 35434
-so 35434
-ge 35150
-h_ 35148
-ch_ 35025
-och 35007
-ing 34078
-om_ 34014
-ko 33815
-ni 33059
-or 32804
-ag 32379
-ör_ 32266
-le 32134
-ri 31221
-d_ 30890
-nde 30448
-ed 30326
-Ã¥_ 29506
-y 29355
-el 29339
-and 28993
-som 28604
-an_ 27640
-ter 27216
-na_ 27106
-ne 27089
-av 27050
-am 26974
-den 26707
-än 26303
-ro 26100
-ll_ 25984
-io 25841
-de_ 25752
-ss 25667
-ra_ 25361
-kt 25247
-be 25168
-ill 25097
-sa 24780
-ska 24454
-v_ 24078
-ut 23751
-va 23642
-ion 23555
-ma 23460
-ve 23199
-se 23159
-mm 22849
-si 22752
-mi 22715
-ha 22205
-i_ 21986
-it 21551
-es 21181
-rs 21080
-da 20962
-fr 20730
-he 20655
-lig 20583
-rn 20406
-ag_ 20283
-tr 20278
-te_ 20181
-til 20149
-till 20081
-ja 19822
-ts 19355
-as 19301
-nte 19169
-med 19136
-gen 19065
-ke 18986
-nn 18971
-isk 18828
-ka_ 18824
-ett 18812
-un 18750
-nin 18697
-ur 18640
-ning 18634
-id 18620
-ande 18587
-ik 18294
-ck 18214
-ta_ 18061
-ad 17944
-pe 17850
-one 17519
-rna 17506
-ill_ 17445
-rå 17287
-kom 17054
-ione 16203
-em 16117
-men 15944
-lle 15910
-ga_ 15637
-på 15632
-der 15493
-ol 15352
-ng_ 15337
-int 15304
-all 15285
-pa 15125
-rt 15043
-omm 15031
-nde_ 14975
-komm 14939
-rä 14891
-rna_ 14628
-jag 14120
-sl 13885
-inte 13700
-era 13672
-pp 13657
-ern 13636
-ing_ 13458
-la_ 13379
-äl 13329
-ek 13323
-ens 13249
-pr 13184
-ät 13117
-gen_ 12951
-ste 12834
-rd 12799
-iv 12776
-ed_ 12715
-ätt 12682
-as_ 12587
-var 12560
-erna 12483
-har 12468
-het 12390
-ska_ 12326
-gr 12169
-nen 12157
-dr 12141
-Ã¥n 12097
-ent 12063
-no 11979
-man 11899
-tta 11826
-op 11801
-eg 11774
-nte_ 11731
-sta 11673
-di 11612
-Ã¥r 11426
-lla 11340
-sä 11296
-gt 11091
-vä 11050
-onen 11038
-eu 11021
-så 11013
-ns_ 10879
-lt 10868
-rin 10844
-sam 10801
-ler 10711
-ver 10695
-iska 10639
-ara 10628
-ter_ 10482
-gar 10424
-ru 10405
-Ã¥g 10338
-frå 10330
-ot 10313
-är_ 10238
-örs 10214
-ten 10210
-fa 10188
-tio 10160
-gs 10106
-to 10096
-ku 10066
-ade 10025
-ell 10020
-mis 10012
-kan 10011
-up 9951
-iga 9948
-tion 9875
-kl 9867
-änd 9862
-gt_ 9849
-iss 9835
-må 9748
-nge 9731
-rl 9725
-rk 9717
-ans 9689
-uro 9647
-eur 9634
-euro 9616
-lä 9610
-förs 9597
-ls 9558
-tä 9551
-ie 9494
-upp 9482
-re_ 9411
-tet 9405
-igt 9403
-nen_ 9399
-ati 9377
-nk 9359
-rop 9343
-ete 9336
-ran 9232
-bet 9156
-urop 9075
-ba 9053
-der_ 9036
-vil 9005
-tta_ 8969
-k_ 8958
-ser 8942
-ring 8910
-kon 8906
-nna 8905
-mer 8891
-po 8778
-ig_ 8722
-tal 8694
-igt_ 8647
-lan 8592
-kr 8591
-Ã¥d 8503
-sio 8464
-sion 8459
-nom 8453
-kti 8364
-ner 8341
-ssi 8340
-ten_ 8269
-rr 8268
-ft 8262
-tu 8259
-nga 8253
-und 8222
-mo 8168
-mmi 8147
-eri 8035
-dra 8026
-miss 7978
-nä 7957
-fo 7911
-ak 7898
-ap 7892
-äll 7879
-ommi 7866
-ler_ 7863
-ef 7849
-ller 7812
-ssio 7801
-ul 7744
-iga_ 7740
-mme 7731
-sp 7718
-ngen 7717
-go 7682
-lla_ 7661
-pro 7636
-dl 7612
-del 7570
-äm 7540
-rb 7539
-ngs 7534
-inge 7506
-fi 7481
-iti 7480
-nder 7465
-den_ 7452
-det_ 7451
-tet_ 7427
-ram 7421
-tn 7417
-lag 7355
-issi 7273
-mmis 7253
-Ã¥t 7249
-are 7208
-tv 7187
-nsk 7067
-gi 7028
-äg 7007
-kt_ 6912
-os 6852
-ndr 6806
-öra 6805
-ts_ 6795
-inn 6771
-ings 6739
-dett 6721
-lit 6720
-etta 6716
-gh 6715
-lu 6715
-vå 6643
-ghe 6642
-ade_ 6640
-öre 6619
-ren 6617
-ghet 6611
-if 6576
-mma 6569
-or_ 6511
-hä 6510
-ks 6440
-öv 6437
-oli 6430
-str 6415
-nna_ 6396
-lj 6352
-stä 6279
-des 6276
-igh 6274
-ide 6273
-mer_ 6272
-Ã¥l 6268
-ekt 6267
-tig 6264
-on_ 6257
-ighe 6244
-liga 6243
-ger 6236
-råd 6233
-Ã¥s 6202
-ia 6185
-res 6179
-ens_ 6167
-rand 6148
-Ã¥de 6142
-rt_ 6110
-före 6089
-gan 6048
-ikt 6038
-da_ 6022
-han 6008
-ste_ 5988
-at_ 5976
-ord 5972
-par 5959
-när 5953
-ara_ 5949
-ket 5932
-ess 5929
-kn 5920
-lt_ 5910
-atio 5886
-tern 5849
-rät 5845
-rätt 5835
-tan 5820
-tte 5817
-bl 5816
-yc 5803
-Ã¥r_ 5800
-yck 5797
-vis 5767
-råg 5743
-fråg 5739
-ers 5736
-ngar 5729
-min 5726
-omme 5713
-tiv 5706
-kal 5701
-lk 5686
-ets 5681
-lut 5664
-ei 5659
-ket_ 5652
-all_ 5610
-het_ 5607
-ment 5602
-tat 5598
-hete 5592
-inga 5591
-dan 5584
-erin 5572
-ligt 5565
-ope 5564
-u_ 5562
-els 5555
-ort 5546
-amm 5543
-sa_ 5529
-gä 5512
-mmer 5468
-fra 5457
-rope 5438
-rm 5417
-are_ 5413
-eis 5411
-pei 5407
-opei 5403
-peis 5403
-råde 5403
-eisk 5398
-ist 5389
-kli 5384
-tni 5379
-ad_ 5378
-sla 5339
-lar 5310
-ms 5305
-ty 5240
-ala 5232
-tnin 5226
-sät 5222
-sätt 5204
-ci 5201
-kap 5192
-st_ 5178
-ull 5175
-dig 5135
-öve 5130
-över 5125
-rbe 5119
-sv 5116
-nst 5109
-for 5107
-sy 5081
-pol 5074
-Ã¥st 5071
-err 5063
-od 5059
-kall 5049
-ock 5022
-ld 5011
-gar_ 4963
-cke 4955
-gå 4945
-eme 4910
-reg 4910
-ker 4909
-p_ 4906
-rf 4884
-dä 4883
-sku 4861
-där 4845
-Ã¥n_ 4836
-poli 4819
-slag 4806
-rat 4805
-nat 4801
-mås 4795
-ds 4788
-Ã¥ng 4783
-måst 4780
-Ã¥ste 4778
-ame 4777
-eda 4776
-skap 4775
-gg 4761
-vara 4760
-tis 4753
-fte 4747
-red 4726
-era_ 4717
-mä 4712
-bi 4711
-land 4689
-skal 4689
-arl 4688
-för_ 4686
-rbet 4686
-ssa 4683
-ce 4680
-arb 4678
-tor 4674
-rde 4670
-ige 4668
-rån 4665
-fram 4659
-fin 4648
-arbe 4643
-lin 4640
-amma 4634
-tra 4617
-fe 4616
-liti 4596
-från 4589
-så_ 4586
-jä 4583
-nå 4582
-olit 4571
-tar 4563
-ec 4559
-og 4550
-kul 4539
-rån_ 4538
-rg 4537
-vs 4536
-gra 4511
-ella 4505
-llt 4502
-gö 4497
-tl 4490
-sen 4478
-nd_ 4474
-unde 4469
-gör 4446
-rst 4442
-nom_ 4440
-ant 4437
-Ã¥go 4436
-akt 4433
-nska 4431
-br 4417
-el_ 4411
-mp 4402
-ate 4401
-älle 4387
-ins 4372
-vill 4366
-ente 4365
-ir 4364
-nda 4362
-tid 4356
-art 4355
-le_ 4345
-ner_ 4343
-erk 4323
-rar 4320
-x 4318
-tisk 4312
-vår 4311
-cks 4306
-uta 4280
-mar 4261
-amen 4254
-ot_ 4246
-ös 4224
-nf 4211
-lle_ 4202
-bar 4193
-lem 4186
-ven 4171
-my 4170
-tro 4166
-igen 4159
-ast 4142
-slu 4129
-nse 4125
-ilj 4124
-gru 4121
-lm 4121
-öd 4121
-tå 4113
-ser_ 4112
-tö 4088
-slut 4080
-mot 4078
-Ã¥ga 4074
-ndra 4050
-arn 4048
-eta 4043
-ycke 4042
-samm 4030
-enn 4028
-oner 4016
-uni 3995
-äv 3993
-fter 3991
-age 3990
-stå 3981
-eter 3973
-ocks 3970
-nt_ 3967
-rla 3967
-tik 3967
-her 3953
-ckså 3944
-kså 3944
-kså_ 3944
-ss_ 3939
-stat 3938
-bo 3930
-äns 3930
-end 3927
-ite 3920
-tera 3908
-pl 3875
-verk 3869
-rr_ 3864
-mr 3855
-skul 3853
-rik 3852
-kla 3846
-mö 3842
-hå 3824
-herr 3821
-sto 3812
-rad 3809
-lam 3808
-tli 3805
-lo 3804
-rsl 3802
-pa_ 3782
-ny 3781
-dess 3779
-rsla 3766
-sta_ 3766
-råga 3764
-vet 3764
-nne 3763
-örsl 3759
-kull 3757
-tur 3754
-ling 3751
-ys 3750
-ssa_ 3737
-kä 3731
-hand 3727
-eno 3725
-arla 3724
-lame 3710
-kte 3707
-ntr 3705
-rlam 3703
-parl 3701
-tag 3701
-bes 3697
-nad 3692
-sf 3688
-ras 3686
-denn 3679
-arna 3666
-nio 3664
-ulle 3662
-je 3661
-rh 3655
-ma_ 3648
-enna 3647
-per 3634
-någ 3630
-in_ 3629
-ege 3623
-dra_ 3617
-elle 3617
-emen 3611
-us 3607
-nion 3606
-ike 3599
-ärd 3592
-pen 3590
-hö 3583
-rar_ 3582
-opa 3577
-ida 3576
-ki 3568
-ster 3567
-nis 3563
-ff 3562
-rli 3552
-im 3550
-ju 3549
-do 3543
-sko 3543
-sig 3542
-unio 3539
-alla 3532
-ropa 3530
-föra 3518
-få 3514
-sti 3513
-dan_ 3512
-omr 3512
-ika 3510
-err_ 3506
-öra_ 3505
-enom 3490
-hål 3488
-Ã¥ll 3483
-änn 3482
-håll 3463
-ret 3463
-ion_ 3462
-ho 3453
-ndl 3449
-lige 3446
-get 3439
-mt 3431
-lå 3430
-kni 3429
-em_ 3427
-tlig 3426
-geno 3425
-vid 3425
-stö 3421
-mf 3418
-län 3415
-sm 3412
-su 3407
-cket 3397
-lik 3397
-nta 3392
-oll 3389
-ktig 3378
-ndet 3366
-lv 3357
-eh 3355
-eten 3339
-ons 3336
-tän 3336
-rö 3331
-nu 3328
-nas 3325
-utv 3323
-nl 3320
-ken 3314
-klig 3313
-mens 3303
-örst 3298
-ckl 3297
-id_ 3297
-est 3288
-lse 3286
-led 3283
-eko 3282
-dn 3274
-eft 3270
-efte 3259
-ela 3258
-myc 3242
-myck 3242
-es_ 3239
-gem 3236
-tre 3234
-ände 3228
-nv 3225
-vän 3225
-ris 3224
-yd 3221
-ok 3220
-ktiv 3219
-eck 3208
-mel 3202
-män 3198
-rv 3195
-kra 3192
-am_ 3190
-orm 3160
-um 3158
-aran 3148
-ndi 3142
-vär 3138
-hel 3137
-sn 3137
-mrå 3136
-mråd 3136
-ntet 3136
-gn 3135
-ial 3126
-ja_ 3126
-uk 3124
-sva 3118
-ex 3116
-mma_ 3114
-al_ 3105
-täl 3102
-stäl 3100
-täll 3100
-lag_ 3094
-man_ 3091
-else 3084
-här 3084
-geme 3081
-ikti 3081
-ats 3072
-ip 3059
-ken_ 3059
-gl 3055
-nar 3055
-andr 3052
-ber 3052
-finn 3051
-dri 3045
-Ã¥det 3038
-områ 3034
-vik 3029
-trä 3026
-uts 3023
-alm 3022
-ina 3020
-rlig 3019
-gand 3018
-lma 3009
-mn 3008
-ras_ 3005
-yn 3005
-sst 2999
-ater 2995
-let 2991
-itik 2989
-allt 2983
-alma 2980
-talm 2977
-o_ 2975
-nter 2961
-ob 2958
-lman 2952
-ala_ 2948
-dni 2944
-dnin 2936
-kv 2936
-run 2936
-itet 2934
-tan_ 2925
-far 2891
-mil 2887
-sse 2878
-llan 2873
-sin 2869
-ena 2866
-ensk 2863
-ver_ 2863
-tg 2862
-tve 2859
-ger_ 2853
-lar_ 2850
-rit 2850
-tate 2840
-llt_ 2837
-nsa 2834
-gäl 2833
-iden 2827
-gäll 2823
-svar 2818
-sk_ 2816
-rek 2799
-knin 2790
-ilk 2789
-vec 2782
-jo 2781
-itt 2780
-vilk 2779
-ono 2778
-veck 2778
-ekti 2776
-ätt_ 2774
-essa 2770
-isa 2766
-göra 2765
-eb 2764
-läg 2762
-ttn 2759
-ino 2758
-edl 2751
-stor 2751
-omi 2747
-äve 2747
-öran 2747
-äk 2746
-kri 2745
-pp_ 2741
-nas_ 2736
-yt 2734
-utan 2733
-aga 2731
-änk 2726
-org 2723
-öj 2723
-ab 2722
-ven_ 2716
-is_ 2711
-dli 2704
-rän 2704
-nkt 2703
-rfö 2698
-dag 2693
-ien 2692
-tti 2689
-bö 2676
-ske 2672
-amt 2669
-and_ 2669
-tvi 2662
-rag 2654
-ckli 2653
-ive 2647
-dd 2646
-rför 2646
-avs 2645
-dern 2645
-beh 2644
-nade 2641
-medl 2640
-ev 2637
-ändr 2630
-onom 2626
-pu 2618
-vikt 2618
-mfö 2612
-mför 2612
-ede 2604
-isk_ 2602
-hu 2597
-spe 2596
-andl 2593
-nns 2591
-yg 2590
-lja 2581
-bä 2578
-nens 2578
-edan 2571
-bör 2570
-sat 2570
-dle 2568
-fl 2568
-edle 2567
-rund 2565
-någo 2562
+# NgramProfile generated at Tue May 31 02:58:09 CEST 2005 for Nutch Language Identification
+e 12381341
+a 11424552
+t 11233978
+r 10219706
+n 9908234
+i 7080311
+s 7068111
+l 5943641
+d 5324422
+o 5030026
+m 4615659
+g 3961250
+k 3698495
+f 2675468
+v 2669465
+ä 2427132
+p 2333847
+u 2089624
+ö 2030505
+h 1935183
+Ã¥ 1787122
+b 1322088
+c 1272541
+j 776970
+y 554744
+x 86640
+w 25587
+z 23955
+é 21355
+q 5214
+á 2656
+à2283
+ü 2001
+ó 1810
+è 1804
+æ 612
+ç 545
+à403
+ò 401
+ú 369
+ñ 313
+ê 297
+ã 234
+ø 188
+ß 184
+ï 111
+ë 105
+º 74
+û 64
+ô 53
+ù 13
+î 11
+â 10
+ì 10
+ý 8
+ð 5
+õ 4
+µ 2
+ÿ 1
+t_ 3614076
+r_ 3466967
+a_ 2837846
+de 2822960
+n_ 2687579
+en 2649825
+er 2450013
+_s 2136237
+et 2134335
+_a 1950547
+_d 1865754
+e_ 1801971
+_f 1768582
+tt 1759213
+an 1758062
+in 1599945
+ar 1572396
+at 1488484
+te 1460917
+ör 1435796
+om 1429963
+_o 1350729
+ll 1349136
+_i 1334772
+ra 1332353
+_m 1258907
+fö 1251825
+_e 1207844
+ti 1190846
+nd 1174140
+st 1141767
+m_ 1090093
+_v 1079731
+ta 1051776
+me 1045960
+na 989394
+_p 969133
+s_ 968893
+i_ 959792
+sk 917390
+ka 916565
+ng 914768
+g_ 907587
+_t 894940
+la 894725
+är 855533
+_k 854987
+re 847096
+oc 804112
+_h 803754
+li 803102
+is 792106
+ig 768596
+vi 761242
+on 757062
+_b 748019
+ge 737364
+ns 727864
+il 702606
+l_ 698911
+nt 695773
+ch 691793
+d_ 690209
+ag 682157
+ga 678218
+or 674152
+h_ 664432
+so 650974
+al 641695
+ni 634754
+le 628379
+ko 626811
+am 602823
+ed 598870
+_u 595142
+ri 592270
+el 585487
+_n 561079
+Ã¥_ 557796
+_g 556036
+_ä 540117
+än 529616
+ne 527196
+av 521287
+be 516147
+_r 494407
+ro 491708
+ss 483007
+sa 476794
+io 471979
+ut 470740
+kt 468786
+v_ 463482
+ma 458044
+ke 454519
+ha 453703
+va 438985
+_l 437879
+se 431829
+es 430201
+ve 427722
+pe 426668
+si 424789
+mm 424495
+rs 414984
+fr 410891
+it 404922
+da 402335
+mi 402106
+rn 394446
+ts 388059
+tr 385012
+ja 383072
+as 376532
+he 375669
+nn 370505
+un 361465
+_j 351079
+id 343239
+ck 340545
+ur 332495
+ad 331595
+rå 329993
+p_ 324107
+ik 308055
+em 306428
+pa 295494
+rd 293812
+rt 292390
+på 287162
+sl 282964
+pp 275984
+ol 275602
+rä 273456
+äl 256263
+pr 246590
+dr 244125
+ät 243259
+ak 240626
+ek 236291
+Ã¥n 229651
+sp 229386
+op 227954
+di 224784
+gr 223798
+Ã¥r 219589
+vä 219540
+gt 217007
+ot 216372
+no 216299
+eu 215750
+sä 213546
+to 204525
+lt 203709
+eg 202436
+tä 201148
+så 199556
+ru 197841
+iv 196753
+rk 196587
+rl 193635
+fa 192361
+gs 189926
+up 188748
+nk 188587
+Ã¥g 186970
+kl 186339
+lä 185280
+ku 185159
+ls 177637
+må 175658
+ba 173985
+kr 170368
+k_ 168786
+ft 163249
+mo 162794
+ul 159403
+Ã¥d 157262
+nä 154637
+dl 154185
+_Ã¥ 152174
+po 151647
+_ö 151376
+ap 150899
+rb 150549
+tu 148596
+fo 148593
+ef 148146
+rr 147470
+fi 142018
+Ã¥t 140401
+go 137786
+lu 135416
+tn 134754
+äg 132087
+äm 131416
+tv 130402
+öv 127114
+vå 127019
+gi 125744
+ks 124270
+kn 121130
+ie 120600
+os 119491
+u_ 117630
+Ã¥s 116648
+gh 116430
+hä 115932
+lj 114947
+Ã¥l 114775
+ei 114531
+bl 113188
+yc 112300
+lk 110925
+ea 105643
+gä 105318
+rm 103113
+ld 102159
+ms 100543
+gå 99771
+sv 97626
+br 97609
+od 96704
+rg 95722
+ty 94813
+mä 90952
+ds 90691
+rf 90030
+sy 89763
+ce 89133
+mp 85904
+gö 85795
+dä 85490
+äv 84784
+bi 84064
+öd 83686
+ec 83008
+og 82882
+vs 82679
+gg 82378
+nå 82206
+tö 81955
+jä 81834
+ös 81611
+tl 81525
+ci 80616
+mö 80387
+rö 79269
+nf 78203
+ua 78142
+lo 77994
+pl 77713
+bo 77444
+ia 76374
+my 76009
+us 75472
+rh 75286
+if 74841
+tå 74770
+kä 74467
+uk 73038
+nu 72532
+sf 72479
+fe 72429
+ju 72166
+ki 71173
+lm 71156
+hå 71053
+ir 70236
+sm 69082
+do 68954
+lå 68913
+ho 68908
+su 68885
+ys 68623
+je 68543
+eh 68017
+dn 67718
+um 67653
+nl 67385
+mt 66940
+mf 66879
+ff 66183
+gu 66064
+df 65139
+få 64393
+o_ 64139
+ny 64134
+nv 63824
+hö 63714
+gn 63460
+jo 63403
+mr 63282
+ex 62501
+rv 62233
+yd 61415
+ob 60802
+lv 60689
+ud 60567
+_c 60416
+gl 59957
+sn 57786
+äk 57067
+tg 57059
+yn 55939
+mn 55706
+öj 55337
+ok 53990
+fl 53511
+af 52985
+ac 52735
+ök 52220
+yt 52041
+ev 51741
+bö 51264
+bu 51098
+dd 50991
+hu 50744
+eb 50510
+ry 49416
+ab 49342
+ic 48873
+dg 48821
+ly 48590
+pu 48277
+du 47901
+tf 47285
+nh 47153
+kv 47070
+db 46891
+bä 46646
+öt 46470
+dv 46199
+lö 44830
+jl 44223
+fu 43976
+im 43848
+ep 43628
+yg 43045
+ov 42684
+vt 42645
+ln 42503
+dj 39704
+sj 39456
+sö 39362
+äs 38560
+äd 37715
+of 37385
+ip 36197
+då 35860
+mb 35009
+pt 34508
+tj 34238
+öl 33783
+ky 32889
+ml 31757
+nö 31568
+hi 31362
+ps 31243
+fä 31229
+nr 31094
+mh 31016
+pn 30987
+by 30089
+rj 30021
+ön 29606
+nc 28565
+lf 28451
+mu 28152
+yr 27655
+jö 27506
+_y 26964
+ya 26932
+pm 26328
+lb 26210
+sb 26038
+sr 26027
+äc 25624
+yl 24700
+öm 24339
+ög 24295
+nb 23766
+tb 23422
+xt 22259
+ib 21696
+oe 21621
+ue 21281
+gj 21201
+dö 21070
+bb 20960
+lp 20958
+sc 20956
+öp 20801
+Ã¥e 20721
+uv 20678
+xe 20642
+tm 20199
+gd 20003
+y_ 19265
+lg 18420
+dt 18328
+hj 18238
+vo 17952
+pf 17922
+pi 17519
+sh 17352
+vr 17282
+äf 17043
+ub 16734
+dk 16619
+th 16058
+ou 15524
+lr 15170
+au 15152
+bå 14817
+_w 14765
+dp 14748
+ih 14586
+yf 14413
+ee 14382
+ca 13973
+co 13885
+kö 13883
+pg 13840
+bs 13650
+ug 13531
+xi 13457
+cc 13426
+vu 13370
+fy 13273
+Ã¥k 13261
+oa 13036
+nj 12533
+lh 12406
+Ã¥v 12236
+oj 11934
+np 11906
+vg 11847
+yk 11538
+mj 11059
+mg 10937
+jd 10845
+äx 10840
+x_ 10008
+sd 9995
+bj 9741
+aj 9643
+j_ 9609
+uc 9483
+yp 9309
+kh 9279
+ai 9179
+sg 9149
+ph 9102
+ym 9101
+f_ 9093
+tp 8937
+c_ 8920
+b_ 8768
+xp 8578
+rp 8575
+vn 8323
+eo 8157
+tk 8052
+Ã¥p 7984
+té 7983
+z_ 7921
+nm 7724
+uf 7724
+én 7519
+vl 7061
+ae 6825
+äp 6720
+xa 6536
+yv 6494
+ui 6470
+md 6265
+ah 6103
+ej 6016
+vd 6014
+bt 6011
+jn 5939
+mv 5901
+gf 5756
+wa 5527
+oo 5514
+vv 5513
+dm 5481
+iu 5462
+oh 5459
+vf 5375
+ö_ 5276
+ez 5215
+fn 4978
+Ã¥m 4949
+rc 4839
+ax 4746
+hy 4737
+é_ 4725
+kd 4662
+vk 4634
+iö 4623
+ée 4614
+mk 4569
+gy 4488
+dé 4482
+ey 4462
+aa 4314
+dy 4257
+qu 4254
+we 4081
+wi 4064
+cy 4049
+pd 3971
+cu 3942
+dh 3941
+kg 3910
+vb 3877
+ii 3874
+öf 3802
+kf 3757
+hr 3752
+gp 3739
+pb 3627
+ij 3621
+gb 3591
+yo 3459
+js 3445
+zo 3436
+ox 3412
+wt 3389
+hl 3300
+kj 3234
+fj 3180
+ye 3169
+_z 3159
+ux 3029
+td 2993
+zi 2965
+ay 2893
+kb 2876
+ow 2852
+pä 2820
+cr 2789
+iä 2648
+pé 2597
+az 2472
+wo 2466
+gm 2428
+Ã¥b 2317
+hm 2313
+hn 2238
+mc 2233
+yb 2212
+ze 2185
+nz 2179
+oi 2170
+ao 2167
+jt 2147
+kk 2132
+za 2119
+kp 2073
+mé 2066
+pk 2031
+ht 1997
+tc 1974
+pv 1921
+öa 1905
+tz 1898
+iz 1884
+kå 1873
+fg 1872
+ew 1863
+bn 1828
+gk 1809
+jk 1739
+km 1698
+cl 1654
+yh 1648
+w_ 1599
+xu 1575
+zz 1529
+oä 1495
+uz 1449
+bv 1408
+cn 1400
+oy 1393
+_q 1373
+Ã¥f 1340
+ál 1338
+ón 1337
+vh 1303
+ct 1298
+cb 1289
+gv 1274
+lz 1140
+ji 1137
+ró 1086
+sw 1078
+hw 1056
+xl 1013
+án 976
+vm 967
+ws 961
+ÃÂn 953
+nè 947
+dz 939
+fs 911
+èv 905
+wh 904
+py 895
+zá 882
+vj 863
+rz 848
+yi 821
+rü 813
+ré 789
+uo 788
+ér 781
+wu 779
+és 750
+cd 742
+eå 741
+aw 740
+oz 736
+öc 725
+ix 724
+bw 719
+üb 699
+ÃÂa 696
+uy 690
+Ã¥h 687
+zu 663
+lc 660
+öo 653
+lé 635
+bh 631
+cq 617
+rà613
+öh 606
+oå 602
+éf 591
+qv 577
+iq 570
+uh 565
+cs 562
+öu 562
+öb 560
+oö 549
+hs 541
+_x 537
+vp 533
+wy 532
+tà526
+eä 520
+öe 519
+uq 507
+wl 482
+_á 481
+zq 472
+vc 454
+xc 454
+ça 453
+cà451
+èr 446
+rw 438
+mü 437
+sq 435
+üh 435
+cm 434
+iè 428
+xk 424
+eö 423
+pö 419
+éd 416
+hé 410
+fb 402
+dq 396
+bæ 391
+æk 391
+ié 390
+xf 376
+nw 372
+sá 372
+wm 368
+xn 359
+zn 358
+bé 352
+ná 352
+rq 352
+iw 350
+ué 350
+dü 342
+sé 341
+zj 336
+vé 335
+ék 330
+ül 327
+uu 326
+ä_ 325
+bk 324
+vö 322
+uw 317
+dw 315
+fp 310
+xo 301
+à_ 301
+ès 301
+sz 300
+rè 299
+tw 298
+öi 297
+ó_ 291
+dà288
+kx 280
+bp 278
+jf 278
+kc 276
+má 276
+êt 276
+ún 275
+él 271
+bd 266
+tê 264
+cú 263
+ün 258
+pc 257
+ég 249
+ÃÂ_ 245
+sò 244
+òl 244
+ão 231
+dc 227
+hc 221
+öö 219
+bc 210
+oç 207
+zb 207
+jæ 204
+ær 204
+ÃÂe 203
+yu 202
+sà198
+lq 196
+só 193
+öw 190
+pj 186
+yx 183
+év 183
+uj 182
+q_ 180
+xx 175
+jh 174
+jp 172
+ét 168
+aå 167
+wn 165
+zs 165
+hh 164
+fk 159
+né 159
+qa 157
+cf 156
+eq 156
+cp 155
+ß_ 154
+éo 153
+ør 152
+zf 148
+cò 147
+añ 146
+fc 146
+éa 146
+Ã¥a 145
+aß 142
+jø 132
+gü 131
+hd 131
+fh 129
+ké 128
+zh 128
+ò_ 128
+gc 127
+fm 126
+ló 126
+ño 125
+hk 122
+rç 122
+zl 122
+ür 122
+_à117
+tx 115
+á_ 115
+hb 113
+óp 112
+öå 109
+Ã¥o 108
+éc 108
+xv 106
+ár 103
+jr 101
+aç 98
+aq 97
+tà97
+iñ 96
+iã 95
+ió 93
+yy 93
+ñe 92
+jb 91
+iy 89
+fé 88
+cé 87
+tó 87
+üs 86
+wr 85
+Ã¥j 85
+éb 85
+äb 84
+_é 83
+zr 83
+às 83
+xm 82
+ém 82
+iå 80
+äy 80
+aï 79
+hf 79
+Ã¥z 78
+bf 77
+hp 77
+fd 76
+oë 76
+vy 75
+_º 74
+là73
+hü 72
+rà72
+éu 71
+ña 70
+nç 68
+rx 68
+tá 67
+º_ 67
+uå 65
+oû 64
+ût 64
+ës 63
+_ó 58
+åå 58
+là57
+èd 57
+bm 55
+jv 55
+kz 54
+xh 54
+ïr 54
+cg 53
+aö 52
+ÃÂg 51
+ÃÂs 50
+rã 49
+xs 49
+cw 48
+oñ 46
+yå 46
+gé 45
+xb 45
+ço 44
+mà43
+mã 43
+zó 43
+jm 42
+lá 42
+uà42
+wb 40
+rá 37
+yá 37
+éi 37
+mè 36
+wf 36
+zk 36
+mw 34
+yj 34
+äi 34
+zc 32
+cj 31
+xj 31
+zy 31
+èg 31
+kw 30
+mó 30
+èn 28
+hô 27
+jü 27
+sã 27
+uö 27
+yw 27
+yö 27
+ép 27
+aà26
+lü 26
+rú 26
+lè 25
+nü 25
+ww 25
+äu 25
+éj 25
+ël 25
+ÃÂo 25
+ôn 25
+eß 24
+ßl 24
+ái 24
+ás 24
+ñi 24
+fv 23
+xå 23
+sø 22
+wü 22
+ác 22
+hv 21
+tü 21
+xg 21
+øl 21
+òs 20
+bg 19
+fó 19
+gw 19
+jú 19
+xy 19
+äe 19
+çi 19
+ï_ 19
+úa 19
+úc 19
+üd 19
+aä 18
+cö 18
+lw 18
+mø 18
+sü 18
+eï 17
+qs 17
+wc 17
+xr 17
+zw 17
+_ß 16
+bá 16
+iá 16
+åö 16
+üg 16
+_ü 15
+cv 15
+hg 15
+iú 15
+sú 15
+vá 15
+xd 15
+ús 15
+aë 14
+dó 14
+nq 14
+oq 14
+uç 14
+vè 14
+zm 14
+zü 14
+ÃÂt 14
+ór 14
+üt 14
+_ê 13
+bü 13
+có 13
+jg 13
+lx 13
+wk 13
+äh 13
+åä 13
+ïs 13
+fá 12
+gz 12
+gó 12
+mà12
+qi 12
+sè 12
+wd 12
+ád 12
+Ã¥i 12
+fü 11
+há 11
+xw 11
+äa 11
+çu 11
+ós 11
+öä 11
+úi 11
+cz 10
+cá 10
+hz 10
+en_ 1763097
+_de 1543569
+et_ 1271365
+för 1221486
+er_ 1218211
+tt_ 1208188
+_fö 965933
+att 954117
+om_ 916831
+_at 856753
+det 840374
+de_ 798738
+_oc 726869
+ar_ 687763
+ch_ 658732
+och 656493
+ing 650440
+nde 649437
+and 631828
+ör_ 614279
+_vi 595780
+_in 594038
+_i_ 569959
+ter 547005
+är_ 535417
+som 535191
+na_ 522965
+_so 520428
+_me 515776
+den 510528
+an_ 509428
+ll_ 483644
+ill 481185
+_av 477570
+ra_ 472875
+_en 445681
+ska 444468
+ion 436887
+_ko 433065
+_ti 420150
+av_ 399108
+lig 394647
+te_ 390774
+til 388310
+ag_ 384871
+nte 381852
+ta_ 380685
+_ha 380242
+med 374675
+gen 374430
+_är 368190
+nin 366408
+ka_ 360772
+ett 360450
+_fr 355814
+_om 351600
+_be 348802
+isk 342530
+rna 339452
+one 330589
+kom 318862
+lle 306791
+men 295386
+int 294115
+der 290691
+ga_ 289781
+ng_ 288740
+_st 288026
+_på 284234
+omm 277894
+_ja 277267
+vi_ 276294
+all 274749
+_ut 273524
+jag 267648
+era 262352
+_sk 261380
+ern 261145
+på_ 254485
+_an 253526
+har 251296
+as_ 245333
+ed_ 243725
+la_ 243242
+_p_ 237959
+ent 237497
+var 236740
+ens 234256
+ätt 233834
+nen 233560
+ste 233035
+sta 231212
+tta 230848
+lla 222173
+het 216970
+lan 216336
+_va 215674
+kan 214783
+man 213946
+ran 211621
+tio 210334
+ler 207855
+_eu 205620
+ver 204444
+gar 204192
+_et 203664
+ns_ 201731
+ara 201293
+örs 200481
+ell 198383
+sam 198294
+änd 197903
+frå 196406
+bet 196347
+rin 193629
+tet 193192
+_re 192651
+ati 191185
+nge 190528
+gt_ 190461
+iga 189607
+ade 188887
+ans 187554
+ten 185981
+uro 184309
+eur 184251
+re_ 183635
+igt 182486
+ame 181625
+upp 179708
+ete 179315
+ker 177710
+mer 177074
+_sa 176082
+nna 175603
+rop 174985
+iss 173124
+vil 172208
+mis 172134
+_si 170364
+_al 170151
+_ka 168553
+_mi 166365
+_ge 165662
+nga 164731
+ig_ 164396
+_pr 163965
+ser 163733
+_ta 163659
+öra 160844
+_un 158541
+_ma 158510
+så_ 158084
+und 156818
+ord 155877
+kon 155669
+dra 155645
+id_ 155566
+tal 155067
+del 153678
+kti 153663
+ner 153639
+nom 153321
+mme 152610
+lag 149947
+äll 149729
+sio 147296
+_må 147235
+ts_ 143818
+ssi 143512
+_he 142294
+ram 141201
+_up 139896
+eri 139787
+ngs 139660
+are 137871
+Ã¥r_ 137277
+mmi 137189
+age 136538
+_sä 136425
+pro 135521
+öre 133890
+nsk 133511
+ndr 133103
+_na 132610
+spe 130466
+des 129258
+kt_ 129160
+mma 126908
+han 125726
+on_ 122427
+res 122252
+da_ 122218
+iti 121735
+_nä 121162
+_sp 121137
+_la 120761
+or_ 119819
+par 118922
+ess 118519
+lit 118517
+inn 118346
+rt_ 118323
+stä 117523
+gan 117071
+at_ 116959
+ers 116823
+tat 116527
+ket 116056
+vis 115070
+råd 114462
+Ã¥de 113968
+ger 113629
+lt_ 113503
+str 113120
+ikt 112823
+ghe 112681
+när 112444
+yck 112239
+ren 112211
+lut 112069
+tan 111818
+sla 111792
+_så 111230
+fra 111097
+ets 110419
+tig 110407
+oli 109592
+ort 109518
+igh 109441
+tte 109251
+sa_ 108935
+rät 107745
+ope 107311
+dan 107230
+_or 107167
+_gr 106955
+råg 105461
+min 104811
+ekt 104611
+ull 104084
+eis 104069
+pei 103622
+rbe 102823
+amm 101864
+els 101677
+_vä 100909
+tni 100701
+öve 100298
+lar 100011
+red 98725
+kli 98571
+dig 98217
+for 98101
+ad_ 97913
+_id 97709
+rat 97610
+_se 97540
+_än 97222
+sku 97192
+ake 97067
+_pa 96611
+Ã¥n_ 96121
+ate 95575
+cke 95373
+nst 95337
+_fi 95231
+Ã¥st 94974
+_fa 94938
+arb 94923
+st_ 94697
+fte 94526
+tiv 94377
+rde 94294
+kal 94139
+_tr 93889
+sät 93783
+_lä 93612
+tra 93553
+tis 93288
+_öv 93228
+arl 93159
+rån 93150
+mar 93029
+nat 93015
+ock 92477
+eda 92438
+eme 91376
+err 91128
+_mo 91085
+ant 91064
+ssa 90758
+_hä 90420
+Ã¥ng 90002
+tid 89945
+nd_ 89803
+mås 89339
+el_ 89315
+llt 88476
+eak 88114
+nam 87998
+lin 87915
+tor 87783
+ven 87472
+akt 87389
+_ve 87135
+le_ 87056
+ist 86708
+fin 86679
+kul 86356
+_rä 86158
+tar 85991
+sen 85913
+pol 85540
+ige 85494
+in_ 85352
+ot_ 85012
+_dä 84851
+där 84770
+ge_ 84584
+rst 84448
+kap 84437
+gör 84356
+me_ 84164
+mot 83984
+slu 83769
+_ar 83492
+nda 83337
+uta 83190
+rla 83021
+ang 82888
+ala 82829
+lam 82762
+rar 82548
+ins 82297
+lem 82235
+tän 81969
+erk 81842
+bar 81707
+arn 81698
+pea 81656
+vår 81361
+get 81319
+Ã¥go 80831
+_ef 79903
+rsl 79639
+_fo 79558
+_Ã¥t 79236
+nne 78847
+enn 78717
+art 78646
+gra 78398
+cks 76751
+ons 76115
+her 76102
+uni 75782
+ss_ 75689
+ite 75491
+rad 75439
+_po 75079
+nse 74892
+nis 74768
+_li 74308
+rr_ 74294
+nta 74149
+_ba 74006
+pen 73565
+end 73408
+gru 73191
+ast 72972
+äns 72610
+kte 72586
+kla 72265
+sto 72195
+eta 72156
+Ã¥ga 72146
+vid 71895
+stå 71842
+bes 71827
+ma_ 71650
+kni 71386
+_my 71347
+_nå 71116
+ndl 71047
+_vå 71018
+ras 70991
+tag 70843
+nad 70700
+ilj 70418
+eno 70286
+nt_ 70258
+tik 70223
+_kr 70218
+sko 70203
+kså 70189
+änk 69886
+län 69805
+es_ 69750
+reg 69583
+tro 68992
+rik 68889
+_di 68866
+ntr 68759
+sig 68224
+ken 67810
+sti 67607
+ärd 67439
+änn 67340
+ike 67161
+stö 66791
+nio 66059
+vän 65925
+ja_ 65738
+lse 65598
+hål 65214
+Ã¥ll 65156
+opa 65120
+tre 65042
+est 65027
+tli 65007
+eft 64911
+rli 64896
+per 64314
+någ 64249
+mel 63982
+nas 63731
+_få 63410
+ndi 63390
+ber 63353
+ris 63306
+em_ 63303
+oll 63279
+ela 63140
+_el 62842
+uts 62798
+ika 62390
+pa_ 62003
+dfö 61991
+_ku 61975
+led 61737
+dri 61613
+kra 61549
+_rå 61516
+äve 61349
+vär 61318
+sst 61101
+ege 60865
+se_ 60820
+dni 60760
+myc 60618
+_gä 60352
+täl 59867
+män 59754
+vet 59591
+am_ 59510
+let 59428
+_sy 59360
+rit 59045
+itt 58968
+kri 58949
+ret 58846
+orm 58491
+_gö 58486
+nka 58301
+_bl 58231
+ina 58102
+_br 58080
+rdf 58050
+it_ 58032
+_er 58020
+lik 57606
+dli 57578
+tur 57573
+utv 57432
+aga 57383
+ats 57283
+al_ 57167
+vik 57054
+omr 57022
+nar 56989
+hel 56716
+rag 56479
+ott 56330
+gem 56211
+sva 56040
+trä 55948
+eck 55785
+ckl 55633
+org 55605
+ilk 55529
+gäl 55505
+edl 55387
+eko 55349
+is_ 55181
+beh 54289
+gua 53663
+_äv 53425
+etä 53393
+ngu 53196
+ede 53190
+lja 53157
+_ni 53060
+uag 52768
+sin 52724
+amt 52696
+ann 52685
+här 52392
+ena 51973
+nsa 51727
+sse 51606
+rfö 51294
+rän 51271
+_ny 51148
+dle 51039
+run 50899
+esl 50870
+tvi 50724
+ari 50612
+_da 50587
+_os 50580
+rso 50555
+mfö 50458
+inf 50392
+nu_ 50375
+_mö 50326
+nkt 50241
+avs 50118
+sat 50114
+_le 49999
+kun 49871
+sit 49779
+ind 49757
+dem 49673
+läg 49634
+ino 49620
+pp_ 49602
+rsk 49520
+rek 49409
+sk_ 49397
+ida 49223
+va_ 49152
+öst 49054
+alm 48815
+ror 48720
+far 48513
+bör 48489
+oss 48443
+ske 48427
+lma 48375
+bli 48116
+nns 48040
+_gå 48035
+jor 48033
+sfö 47938
+tti 47887
+bor 47882
+_nu 47455
+nel 47389
+_Ã¥r 47166
+nan 47166
+kar 47018
+ppe 46788
+_ty 46723
+tve 46633
+_pe 46542
+unk 46335
+rig 46323
+lke 46244
+_bö 46116
+mrå 46108
+ttn 46050
+mil 45952
+vec 45934
+isa 45832
+kor 45770
+dag 45737
+ier 45538
+gär 45536
+rga 45405
+apa 45313
+ark 45092
+kna 45069
+ems 44922
+ski 44834
+omi 44823
+ttr 44704
+_hu 44575
+pri 44523
+_sl 44401
+ono 44265
+ruk 44262
+jli 44208
+öjl 44204
+gor 44203
+töd 44158
+möj 43860
+örd 43752
+_ho 43439
+ur_ 43247
+_mä 43099
+säk 43056
+ori 43039
+lls 42576
+gån 42555
+fat 42452
+ali 42259
+mst 42195
+gsf 42119
+itu 42067
+ni_ 42021
+kat 41727
+_ra 41693
+len 41393
+val 41385
+ise 41346
+ift 41343
+_ex 41315
+äng 41256
+rkl 41234
+skt 41074
+cka 40978
+pun 40630
+ert 40524
+örb 40501
+ut_ 40485
+ytt 40123
+lis 40081
+uti 39983
+jäl 39876
+ukt 39817
+unn 39562
+ini 39424
+ive 39396
+kän 39322
+mån 39253
+vad 39230
+rer 39201
+ck_ 39062
+tsk 38999
+elt 38966
+_te 38918
+pas 38887
+iv_ 38857
+ke_ 38820
+ägg 38794
+iva 38793
+ere 38644
+kil 38576
+väl 38558
+_bi 38552
+_fl 38482
+än_ 38481
+_tv 38374
+ani 38100
+rs_ 38026
+ärf 38011
+säg 37937
+spr 37927
+kol 37876
+emo 37851
+_ek 37844
+rup 37720
+ial 37616
+dam 37510
+tyd 37469
+tas 37406
+äga 37367
+mss 37295
+erh 37214
+met 36913
+opp 36871
+ont 36706
+por 36688
+rti 36541
+ära 36508
+_sj 36447
+rka 36406
+_ri 36331
+omf 36132
+_sv 36131
+kot 35921
+tts 35921
+ble 35911
+tem 35894
+gga 35847
+tri 35758
+_rö 35756
+egi 35746
+sys 35612
+_bo 35591
+_kl 35439
+teg 35412
+ik_ 35380
+fal 35278
+äke 35244
+bil 35070
+nti 34930
+nli 34890
+ide 34881
+ale 34824
+rhe 34799
+dar 34715
+tad 34609
+rös 34496
+ust 34396
+rkn 34380
+_lå 34328
+_ju 34246
+erl 34132
+ffe 34057
+skr 33962
+ape 33686
+idi 33601
+rre 33586
+pek 33535
+leg 33425
+bud 33403
+dla 33396
+nfö 33287
+cen 33193
+pre 33153
+obl 33005
+_hö 32930
+lat 32927
+tsl 32906
+_bu 32862
+läm 32830
+rma 32639
+dis 32615
+kta 32557
+ire 32555
+möt 32489
+_fu 32467
+rts 32349
+mig 32316
+ämn 32225
+ämp 32127
+rol 32121
+ärk 32072
+Ã¥tg 32059
+tgä 32053
+fri 32043
+rot 31879
+syn 31752
+ien 31734
+mat 31712
+rob 31683
+öte 31625
+Ã¥te 31605
+gon 31587
+gni 31549
+edr 31452
+då_ 31417
+nor 31415
+nsi 31373
+raf 31354
+spo 31271
+sli 31094
+sök 30991
+dir 30943
+pla 30897
+rte 30818
+atu 30761
+_go 30760
+sak 30755
+örh 30723
+_to 30674
+gre 30654
+vå_ 30513
+van 30477
+rme 30421
+tru 30395
+_kä 30390
+_do 30388
+ntl 30327
+_kv 30147
+tit 30026
+amh 30021
+vin 29928
+ack 29913
+sni 29804
+mti 29671
+nni 29626
+mål 29548
+rdn 29490
+tin 29346
+Ã¥nd 28948
+try 28841
+olk 28753
+ume 28723
+sid 28689
+krä 28579
+mit 28565
+nvä 28523
+roc 28476
+Ã¥ra 28465
+_ol 28358
+lni 28329
+sky 28269
+tån 28257
+lös 28205
+ute 28189
+hän 28168
+_hå 28150
+ank 28033
+ung 27959
+ölj 27957
+nhe 27910
+lde 27894
+_ga 27876
+gna 27845
+väg 27841
+soc 27806
+ärs 27689
+tst 27681
+sol 27654
+rog 27648
+tör 27606
+öka 27593
+få_ 27582
+nke 27430
+föl 27347
+oci 27240
+_eg 27212
+ama 27179
+app 27153
+pel 27138
+ult 27085
+ora 27062
+ha_ 27031
+stn 26992
+äst 26977
+cia 26907
+rod 26894
+bru 26877
+ogr 26845
+ild 26844
+ags 26781
+_of 26770
+got 26764
+nit 26738
+häl 26717
+oce 26625
+_då 26619
+nal 26563
+enh 26559
+efo 26450
+hur 26444
+_nö 26418
+ral 26403
+äge 26400
+täm 26381
+ktu 26372
+lta 26261
+ört 26203
+får 26110
+gst 26096
+ors 26071
+dge 26064
+je_ 26059
+god 25987
+liv 25969
+ppm 25914
+låt 25882
+eu_ 25835
+amf 25776
+rva 25753
+Ã¥da 25744
+yst 25659
+räd 25638
+äck 25623
+Ã¥t_ 25529
+tsä 25505
+sjä 25480
+ful 25427
+ona 25384
+riv 25379
+ana 25344
+nya 25344
+son 25340
+edb 25237
+nsl 25157
+las 25150
+ivi 25149
+orn 25129
+mna 25113
+sär 25070
+rel 25068
+beg 24935
+tif 24911
+yss 24892
+pap 24834
+älv 24824
+udg 24649
+nsv 24648
+fol 24586
+_no 24454
+ya_ 24333
+tär 24295
+_jo 24268
+går 24255
+inr 24240
+dom 24214
+mpe 24178
+sek 24127
+tac 24093
+lln 24068
+anv 23989
+um_ 23956
+onä 23950
+egr 23897
+bef 23862
+örf 23844
+kel 23789
+enl 23698
+_lö 23697
+lst 23617
+räv 23574
+alt 23507
+tår 23496
+git 23476
+rsö 23456
+_pu 23353
+örv 23336
+bät 23325
+bat 23240
+rda 23204
+ele 23184
+ene 23183
+rör 23183
+dbo 23158
+odu 23112
+oms 23095
+ämm 23089
+utt 23036
+erg 23015
+tut 22954
+nöd 22913
+tom 22911
+näm 22910
+mt_ 22895
+esk 22889
+lad 22859
+grä 22847
+sna 22789
+sik 22731
+ars 22626
+mär 22624
+fle 22600
+mli 22573
+kas 22565
+erv 22505
+rak 22500
+deb 22448
+eba 22425
+aft 22384
+ban 22352
+sed 22285
+_dr 22280
+ore 22219
+fru 22187
+lva 22167
+rn_ 22128
+okr 22113
+agi 22108
+nds 22075
+änt 21988
+_pl 21930
+sme 21872
+ppa 21854
+ots 21840
+ehö 21773
+rfa 21697
+fas 21608
+tjä 21599
+ilt 21577
+pli 21553
+jan 21496
+mor 21468
+Ã¥tt 21458
+ksa 21407
+ls_ 21377
+ick 21360
+rd_ 21356
+avt 21272
+bek 21269
+onk 21182
+tsa 21177
+ärl 21124
+vta 21103
+san 21029
+_em 20989
+ane 20970
+rks 20959
+dvä 20938
+esu 20906
+ton 20896
+gjo 20856
+hop 20856
+vit 20851
+_för 941391
+att_ 867673
+_att 854859
+det_ 683991
+_det 674929
+och_ 656086
+_och 655640
+för_ 542206
+som_ 524062
+_som 482692
+ande 421396
+den_ 406003
+_av_ 387035
+till 385865
+_til 371173
+ning 364851
+_är_ 355707
+_den 351727
+_med 349006
+_en_ 347862
+ill_ 337367
+nde_ 316131
+ione 300030
+_de_ 291083
+_int 287025
+rna_ 281871
+_vi_ 276115
+komm 276053
+_om_ 273591
+_kom 270873
+_jag 267614
+jag_ 267453
+inte 264453
+gen_ 254437
+_på_ 253953
+ing_ 250821
+_har 247594
+erna 244351
+har_ 242883
+ska_ 237450
+med_ 234902
+nte_ 226470
+ett_ 216629
+ter_ 211545
+tion 204687
+onen 201072
+iska 197320
+_ett 196819
+förs 188942
+nen_ 186498
+euro 183505
+_eur 179518
+tta_ 177621
+urop 169969
+der_ 169636
+_frå 169080
+igt_ 166484
+ring 162044
+_vil 156983
+_all 152728
+ller 152391
+ten_ 152249
+mer_ 151930
+ngen 151637
+ler_ 151570
+tet_ 151488
+lla_ 150682
+rand 150304
+iga_ 147948
+inge 147191
+sion 147096
+nder 144556
+_upp 139595
+miss 138064
+_var 137944
+ommi 135507
+etta 133894
+dett 133388
+ssio 132564
+ker_ 132167
+man_ 129178
+ade_ 127907
+atio 126012
+nna_ 125271
+ings 124370
+_kan 123185
+före 122377
+tern 122347
+issi 121577
+mmis 121034
+_sam 120165
+kan_ 119051
+liga 118931
+ngar 117065
+omme 114908
+ens_ 113920
+ment 113875
+_ska 113142
+inga 112309
+ghet 111941
+ste_ 110363
+ket_ 110115
+ighe 108921
+mmer 108437
+rätt 107659
+ara_ 107308
+ligt 107101
+_fra 106755
+men_ 106611
+fråg 105349
+rope 103920
+eisk 103308
+peis 103278
+opei 103276
+are_ 103215
+_kon 102195
+_pro 100593
+_spe 100528
+över 100240
+hete 100108
+tnin 99054
+föra 98896
+råde 98433
+all_ 97746
+gar_ 97519
+slag 96946
+het_ 96913
+fram 96852
+_bet 95317
+ente 95220
+rbet 94510
+arbe 93532
+erin 93338
+sätt 93258
+_man 92618
+land 92514
+ella 91248
+från 91057
+rån_ 90394
+unde 89834
+vara 89753
+era_ 89262
+måst 88981
+_mås 88960
+Ã¥ste 88936
+aker 88673
+ser_ 88147
+amma 87881
+amen 87650
+nom_ 86498
+_men 84980
+_id_ 84900
+_nam 84538
+kall 84506
+_när 84495
+_där 84343
+_und 84204
+tisk 83561
+slut 83170
+_öve 82864
+name 82512
+öran 82282
+lle_ 82159
+älle 81773
+hand 81603
+ame_ 81293
+ner_ 81284
+spea 81284
+stat 81281
+peak 81256
+eake 81249
+poli 80761
+_des 80677
+_lan 80069
+fter 80007
+vill 79742
+rsla 78753
+nska 78679
+när_ 78677
+örsl 78648
+dess 77989
+lame 77838
+skal 77699
+ndet 77634
+ndra 77599
+arla 77576
+rlam 77447
+tera 77298
+parl 77280
+liti 77253
+olit 77048
+igen 76919
+_gen 76744
+skap 76550
+ycke 76256
+_sku 75974
+skul 75951
+oner 75846
+samm 75552
+_par 75420
+_så_ 75214
+_rät 74590
+sta_ 74169
+kull 73620
+_her 73582
+ulle 73563
+_tal 73471
+ssa_ 73148
+_ans 72691
+_han 72576
+herr 72082
+arna 71802
+dra_ 71798
+eter 71717
+_ock 71071
+_ord 70905
+enna 70720
+denn 70683
+_min 70514
+ocks 70308
+ling 70254
+kså_ 70166
+ckså 70165
+elle 70003
+kand 69565
+verk 69554
+_fin 69364
+dan_ 67710
+ion_ 67637
+Ã¥det 67517
+err_ 67286
+öra_ 66864
+råga 66774
+rar_ 66722
+enom 66643
+ntet 66566
+ater 66460
+alla 65765
+geno 65617
+lige 65562
+_uni 65544
+nion 65266
+håll 64833
+klig 64824
+efte 64800
+_vår 64613
+_någ 64249
+ropa 63929
+lag_ 63907
+unio 63889
+cket 63618
+ände 63414
+tate 63284
+_sig 63228
+_gru 63065
+örst 62606
+else 62600
+eten 62487
+ger_ 62479
+_bes 62477
+tänk 62368
+emen 62367
+_eft 62305
+nter 62095
+mma_ 61952
+dför 61904
+aran 61740
+ken_ 61720
+sig_ 61571
+ktig 61169
+dnin 60656
+myck 60606
+nden 60605
+_myc 60582
+andr 60560
+ster 60026
+ras_ 59973
+_råd 59920
+_arb 59857
+tlig 59842
+stäl 59828
+täll 59827
+_stö 59662
+_mot 59493
+ven_ 59488
+gand 58985
+knin 58585
+allt 58526
+andl 58104
+mot_ 57851
+rdfö 57827
+ordf 57823
+tan_ 57471
+_gör 57250
+rlig 57013
+_and 56837
+_reg 56616
+mens 56540
+var_ 56174
+_for 56136
+llt_ 56124
+finn 56108
+änka 55601
+ikti 55557
+get_ 55549
+_hel 55368
+vilk 55361
+and_ 55352
+gäll 55273
+_gäl 55244
+essa 55206
+_utv 55014
+_sta 54995
+lang 54879
+llan 54304
+ver_ 54276
+age_ 53782
+ätt_ 53744
+även 53458
+_äve 53423
+itet 53130
+tar_ 52960
+geme 52878
+drag 52814
+angu 52807
+ngua 52790
+guag 52766
+uage 52766
+ets_ 52740
+medl 52671
+göra 52526
+_änd 52519
+ktiv 52370
+länd 52285
+_gem 52241
+nas_ 52028
+_pol 51937
+ändr 51331
+_uta 51242
+_del 51153
+_här 51058
+etän 50963
+betä 50917
+stor 50914
+edle 50888
+svar 50874
+nkan 50784
+_ver 50764
+_res 50565
+mför 50455
+let_ 50277
+rför 50195
+nade 50012
+utan 49823
+lar_ 49674
+edan 49557
+_ell 49497
+_vid 49375
+_vis 49353
+ndig 49147
+vänd 49026
+erso 48932
+_beh 48737
+_inf 48583
+vikt 48384
+sen_ 48376
+itik 48257
+här_ 48120
+_kun 47991
+form 47969
+dlem 47951
+sför 47842
+ensk 47789
+alma 47545
+talm 47475
+lman 47452
+ende 47383
+nns_ 46882
+_bar 46793
+mell 46702
+_vik 46630
+dern 46465
+ärde 46171
+_ins 46095
+mråd 46081
+drin 46024
+nati 45976
+veck 45821
+ndri 45778
+_oss 45686
+nser 45656
+nell 45440
+_sto 45438
+inst 45368
+rade 45307
+oss_ 45265
+ters 45095
+isk_ 45052
+unkt 44907
+_län 44895
+någo 44547
+orga 44450
+ckli 44341
+ligh 44295
+jlig 44204
+öjli 44204
+_dem 44166
+stöd 44157
+garn 44109
+ekti 44080
+_avs 43971
+onel 43916
+rund 43904
+möjl 43860
+_bör 43792
+områ 43720
+ent_ 43532
+ala_ 43529
+lems 43469
+inom 43396
+_ino 43391
+mman 43205
+ttni 43165
+nens 43032
+ram_ 42943
+ssta 42928
+inns 42631
+gång 42551
+_nat 42501
+onom 42320
+grun 42222
+bara 42051
+kter 42007
+bete 41666
+tala 41343
+_sin 41324
+gare 41186
+skt_ 40943
+ngsf 40672
+dels 40609
+erar 40603
+ilke 40561
+förb 40458
+_omr 40370
+_möj 40206
+punk 40165
+upp_ 40163
+erad 39858
+_mil 39830
+eckl 39817
+Ã¥ga_ 39756
+rder 39664
+iskt 39515
+ika_ 39499
+eras 39425
+fatt 39405
+rati 39380
+lan_ 39350
+lig_ 39226
+del_ 39218
+ätta 39181
+ort_ 39151
+ekon 39013
+olle 38740
+utve 38659
+vet_ 38623
+tvec 38582
+nomi 38096
+lägg 38075
+klar 37997
+_sät 37932
+skil 37874
+ärfö 37838
+därf 37813
+_nu_ 37753
+vad_ 37595
+kono 37545
+_vad 37458
+_tid 37358
+_str 37303
+leda 37189
+_eko 37172
+emss 37117
+digt 37081
+msst 37046
+ats_ 36936
+milj 36936
+kons 36920
+_uts 36888
+rens 36870
+_män 36802
+anse 36699
+inne 36676
+ren_ 36526
+pen_ 36438
+tike 36410
+_stä 36361
+Ã¥gor 36355
+_ni_ 36346
+vis_ 36251
+rupp 36179
+ansk 36159
+nga_ 36153
+ändi 36064
+_bli 35892
+_mån 35877
+_tro 35785
+_säg 35732
+eger 35544
+itis 35491
+tter 35448
+rågo 35398
+len_ 35340
+_inn 35319
+kunn 35261
+ttig 35186
+port 35050
+unna 35003
+lja_ 34808
+gsfö 34787
+rsta 34756
+nlig 34628
+_ber 34604
+ilja 34395
+_dag 34320
+eslu 34310
+samt 34163
+utio 34007
+tid_ 33956
+_mel 33940
+gan_ 33925
+vid_ 33911
+aget 33846
+rnas 33765
+ina_ 33716
+omis 33684
+_led 33616
+rhet 33567
+agan 33486
+nsam 33470
+_sit 33407
+gor_ 33349
+edel 33330
+skot 33305
+iser 33198
+nför 33198
+kott 33150
+röst 33121
+_ant 33067
+förd 33048
+rekt 32908
+lket 32873
+ensa 32858
+tiv_ 32805
+gärd 32774
+äker 32771
+säke 32767
+nar_ 32742
+agen 32662
+_mer 32599
+teri 32318
+besl 32260
+anta 32106
+opa_ 32045
+_mar 31999
+tgär 31949
+åtgä 31944
+des_ 31940
+bets 31923
+rsom 31864
+beta 31828
+nda_ 31756
+ions 31617
+_pri 31585
+akti 31448
+där_ 31240
+tten 31203
+ttet 31157
+tsko 31132
+fort 31093
+atta 31042
+gnin 31040
+dlin 30977
+visa 30962
+oble 30915
+robl 30902
+tiga 30804
+klin 30786
+misk 30784
+_red 30764
+art_ 30747
+förh 30699
+cent 30679
+mark 30678
+tigh 30666
+_mig 30639
+blem 30608
+prob 30592
+tas_ 30577
+atte 30566
+grup 30505
+_säk 30493
+koll 30380
+reda 30363
+erhe 30337
+iken 30313
+Ã¥ter 30309
+fall 30304
+mede 30223
+dire 30202
+irek 30174
+lage 30129
+itt_ 30058
+ndli 29993
+utsk 29971
+ntli 29959
+möte 29912
+äga_ 29885
+ndla 29872
+stra 29828
+_slu 29799
+_vär 29795
+vilj 29711
+otte 29702
+_lag 29598
+_ing 29491
+mig_ 29364
+ättn 29359
+ordn 29253
+_än_ 29196
+rikt 29179
+Ã¥nga 28974
+tigt 28900
+viss 28881
+_Ã¥r_ 28788
+bör_ 28759
+knad 28757
+nisk 28712
+lera 28643
+erkl 28577
+rkli 28562
+_stå 28463
+roll 28459
+_väl 28435
+kape 28406
+orde 28296
+stån 28249
+tånd 28170
+ätti 28158
+disk 28135
+ete_ 28120
+öret 28072
+ndel 28052
+lnin 28034
+llet 27906
+fara 27892
+tat_ 27847
+_Ã¥tg 27773
+amti 27765
+mtid 27755
+luta 27729
+dag_ 27691
+rite 27609
+tik_ 27490
+våra 27480
+dera 27469
+vår_ 27444
+lika 27437
+_få_ 27430
+erat 27413
+_kol 27404
+kar_ 27356
+kont 27333
+_per 27124
+soci 27118
+ror_ 27053
+lite 27004
+pas_ 26975
+Ã¥ng_ 26973
+elt_ 26944
+rans 26896
+följ 26879
+tvis 26871
+dela 26833
+nner 26831
+mång 26819
+nhet 26791
+samh 26730
+jord 26716
+ans_ 26653
+sera 26626
+gör_ 26584
+lser 26514
+dlig 26449
+arkn 26413
+tand 26405
+_kri 26401
+rkna 26387
+reta 26368
+proc 26362
+_hur 26321
+älla 26319
+roce 26317
+ativ 26299
+met_ 26279
+cial 26221
+umen 26189
+Ã¥ra_ 26166
+geri 26092
+ogra 26088
+_får 26056
+stem 26055
+Ã¥gan 26047
+apar 25999
+_ta_ 25995
+får_ 25955
+tets 25951
+_dir 25931
+_Ã¥te 25889
+stäm 25865
+_ha_ 25847
+tal_ 25831
+_soc 25762
+igar 25676
+männ 25614
+säga 25612
+enta 25603
+idig 25591
+rege 25523
+_eu_ 25501
+_sys 25452
+infö 25447
+min_ 25426
+esse 25423
+ätte 25396
+_sjä 25364
+_dis 25359
+full 25358
+diga 25355
+_bud 25335
+_hän 25320
+nvän 25224
+edra 25205
+_god 25167
+värd 25159
+känn 25153
+uppe 25150
+lleg 25131
+dem_ 25030
+ocia 25016
+ppen 24941
+medb 24931
+rdni 24891
+stru 24841
+öred 24830
+_hål 24823
+iste 24799
+rde_ 24776
+orts 24723
+prod 24646
+ärsk 24633
+själ 24629
+prog 24614
+_sär 24607
+digh 24606
+lse_ 24560
+dget 24539
+redr 24534
+Ã¥lla 24522
+budg 24497
+udge 24487
+hur_ 24478
+folk 24438
+jälv 24386
+rogr 24329
+nern 24290
+best 24256
+nya_ 24140
+borg 24116
+krat 24114
+iden 24089
+_vet 24079
+rski 24073
+rat_ 24049
+_nya 24045
+edam 24032
+gram 24019
+nkt_ 23969
+iva_ 23958
+onär 23939
+ionä 23916
+sin_ 23875
+_tre 23864
+lut_ 23784
+_er_ 23778
+yste 23731
+got_ 23711
+ätts 23683
+särs 23632
+anvä 23606
+anna 23573
+bruk 23573
+öres 23565
+förf 23556
+enli 23467
+tack 23464
+ien_ 23459
+ättr 23416
+Ã¥got 23359
+nat_ 23355
+syst 23342
+bätt 23325
+_då_ 23310
+förv 23299
+amfö 23271
+räns 23246
+papa 23237
+går_ 23130
+spek 23129
+anis 23115
+rgan 23081
+ära_ 23064
+enda 23063
+omfö 23036
+_kla 22987
+dbor 22978
+tsät 22959
+edbo 22957
+ägga 22913
+entl 22903
+_anv 22881
+ansv 22805
+_tac 22800
+rodu 22786
+opap 22779
+tår_ 22753
+inna 22670
+snin 22643
+_föl 22623
+står 22611
+gon_ 22587
+amar 22556
+pekt 22538
+ress 22532
+demo 22520
+regi 22460
+skri 22385
+lämp 22325
+sikt 22285
+eren 22278
+ela_ 22258
+risk 22254
+tre_ 22157
+rad_ 22154
+kerh 22140
+arti 22093
+stan 22087
+atis 22066
+träd 22041
+_ann 22036
+nomf 21993
+_lik 21975
+_fru 21945
+rsök 21940
+kten 21929
+omma 21835
+tämm 21751
+batt 21740
+nsva 21692
+sern 21681
+orma 21633
+grän 21625
+_bor 21607
+_beg 21579
+deba 21547
+issa 21533
+ebat 21526
+intr 21513
+rgar 21503
+okra 21487
+marb 21485
+enhe 21475
+_nöd 21416
+märk 21401
+tidi 21373
+_fle 21372
+_pun 21317
+behö 21289
+aden 21283
+mati 21213
+stri 21178
+_utt 21161
+rike 21140
+_deb 21106
+Ã¥gon 21079
+sama 21077
+slig 21024
+_fal 21000
+_pre 20983
+ören 20972
+avta 20918
+nsti 20905
+_inr 20861
+gjor 20856
+ktio 20848
+_enl 20832
+taga 20828
+part 20823
+vtal 20806
+ksam 20803
+etag 20748
+stit 20746
+gra_ 20743
+ena_ 20704
+fört 20689
+_rik 20688
+_bef 20676
+änna 20601
+tjän 20585
+mokr 20569
+emok 20563
+_tra 20535
+tor_ 20511
+rnat 20497
+pers 20494
+stör 20489
+mins 20484
+dvän 20438
+ikt_ 20431
+ända 20429
+nnan 20419
+nödv 20386
+titu 20383
+fekt 20374
+aste 20370
+ast_ 20350
+ödvä 20343
+agit 20330
+kapa 20329
+ess_ 20327
+konk 20302
+_mål 20266
+aren 20255
+tran 20240
+_näm 20225
+orme 20220
+rukt 20199
+erli 20194
+itut 20178
+iljö 20173
+ntre 20121
+ontr 20103
+tora 20047
+_krä 20010
+ills 19918
+tror 19903
+_bek 19894
+ora_ 19855
+_ytt 19836
+_gra 19831
+ekt_ 19822
+atur 19790
+tens 19787
+_två 19771
+resu 19755
+olut 19747
+_jor 19732
+fakt 19706
+Ã¥gra 19702
+någr 19700
+_sed 19648
+_sky 19642
+tive 19631
+ryck 19628
+mitt 19624
+isku 19616
+alis 19613
+vari 19596
+trol 19562
+Ã¥de_ 19558
+_val 19550
+nta_ 19530
+uppm 19524
+effe 19518
+ffek 19517
+_rös 19496
+ekte 19489
+Ã¥rt_ 19430
+Ã¥lle 19321
+ästa 19320
+lags 19318
+_fas 19302
+gift 19281
+ders 19273
+_fri 19261
+han_ 19238
+tuti 19219
+stän 19206
+seda 19201
+estä 19194
Index: src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/de.ngp
===================================================================
--- src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/de.ngp (revision 180032)
+++ src/plugin/languageidentifier/src/java/org/apache/nutch/analysis/lang/de.ngp (working copy)
@@ -1,1002 +1,3060 @@
-# NgramProfile generated at Sat Sep 25 16:08:06 EEST 2004 for Nutch Language Identification
-ngram_count 20847965
-e 1151190
-_ 1150751
-n 733104
-i 602224
-r 531495
-s 423396
-t 416278
-a 360281
-d 360250
-n_ 304953
-h 303720
-en 292104
-u 280236
-er 247008
-l 233780
-g 224725
-en_ 212537
-c 198744
-ch 187848
-o 186738
-m 185592
-e_ 180356
-r_ 152958
-de 152937
-ie 129449
-b 128294
-t_ 124601
-ei 121417
-f 118802
-in 115108
-un 114796
-w 107350
-ge 105302
-te 103038
-er_ 97007
-k 92955
-z 87190
-nd 85991
-s_ 82998
-be 81450
-ic 80748
-es 79104
-di 78545
-ich 77459
-he 73422
-der 70584
-re 70009
-die 69388
-st 68445
-ng 68133
-ie_ 67956
-v 66322
-p 62085
-ne 61973
-it 60771
-se 57918
-is 56911
-an 56775
-sc 56678
-sch 56571
-h_ 54287
-ein 53912
-ch_ 53750
-d_ 51522
-ü 50493
-au 50146
-ung 50103
-ä 49942
-on 48585
-li 46806
-g_ 46517
-che 45855
-ht 45318
-da 44643
-le 44452
-nd_ 44410
-den 43865
-si 43514
-ti 43179
-nt 42981
-me 42878
-cht 41763
-wi 41332
-zu 40258
-m_ 40055
-ra 38470
-gen 38128
-und 38106
-we 36959
-el 36639
-al 35298
-ha 35012
-ng_ 34359
-ten 34283
-or 33438
-ß 32384
-ns 32177
-ung_ 32156
-mi 31541
-ll 31351
-ar 31146
-at 30896
-ni 30669
-hen 30448
-ten_ 30096
-vo 29375
-ve 29316
-em 29128
-ur 28679
-ss 28593
-rd 28554
-ri 28434
-on_ 28090
-nde 28026
-ig 27786
-eit 27645
-ine 27612
-gen_ 27582
-eine 26935
-icht 26811
-hen_ 26229
-rt 26202
-ir 26031
-ver 25977
-hr 25440
-et 25208
-chen 24419
-as 24126
-ere 23829
-us 23821
-io 23638
-eh 23636
-ro 23468
-es_ 23403
-men 23322
-wir 23199
-ht_ 23170
-ent 23092
-ber 23064
-ts 22768
-lic 22696
-te_ 22547
-ru 22443
-ion 22420
-sche 22114
-lich 22109
-rs 21533
-na 21400
-eg 21208
-u_ 21137
-ko 21023
-eu 20862
-mm 20856
-nen 20719
-so 20680
-it_ 20622
-nn 20618
-ol 20583
-la 20494
-tr 20439
-ab 20315
-ter 19791
-ö 19719
-cht_ 19687
-nge 19645
-ß_ 19312
-ür 19294
-nen_ 19292
-ich_ 19289
-ste 19037
-lt 18953
-den_ 18896
-ese 18528
-fü 18265
-pr 18219
-isc 18191
-isch 18184
-uf 18114
-rde 18054
-ren 17925
-am 17232
-ta 17136
-ies 17036
-em_ 16827
-as_ 16824
-ke 16783
-ag 16677
-her 16547
-mit 16540
-run 16334
-lle 16293
-ist 16266
-ne_ 16249
-sa 16211
-aß 16122
-dies 16075
-l_ 16074
-st_ 16034
-auf 15984
-fe 15894
-im 15654
-um 15516
-ers 15463
-aus 15388
-ze 15258
-ed 15130
-om 14999
-tz 14977
-ier 14586
-rn 14548
-iese 14382
-sen 14337
-ir_ 14326
-ma 14202
-iche 14109
-rei 14034
-sse 14015
-ion_ 13782
-ft 13643
-kt 13636
-nder 13535
-für 13527
-aß_ 13516
-hl 13462
-in_ 13322
-nte 13283
-ben 13252
-daß 13186
-ür_ 13142
-f_ 13112
-rung 13081
-end 13019
-ah 12989
-ige 12988
-vor 12973
-das 12972
-ac 12952
-ren_ 12936
-von 12898
-he_ 12692
-ges 12653
-tu 12617
-ern 12573
-il 12549
-gr 12482
-ach 12465
-bei 12435
-ine_ 12291
-des 12273
-wer 12200
-fr 12192
-ngen 12180
-hi 12118
-tt 11996
-uc 11975
-men_ 11908
-and 11857
-sp 11759
-eb 11651
-ls 11616
-ert 11570
-omm 11562
-sic 11525
-sich 11522
-len 11498
-che_ 11459
-ut 11454
-ge_ 11402
-nic 11202
-nich 11178
-af 11111
-eru 11090
-abe 11072
-kom 11050
-eit_ 11048
-uch 11046
-rl 11030
-rden 11025
-sen_ 11013
-rg 11001
-wa 10948
-ind 10872
-j 10872
-gs 10857
-wei 10852
-ec 10805
-op 10745
-nz 10735
-len_ 10635
-gl 10541
-uf_ 10457
-erd 10409
-tl 10349
-sta 10319
-tig 10262
-tio 10247
-tion 10238
-gi 10219
-erun 10217
-komm 10212
-hte 10203
-chte 10150
-üb 10124
-rb 10064
-hre 10019
-pa 10009
-zi 9955
-eur 9917
-ben_ 9912
-ner 9909
-ser 9905
-än 9883
-ell 9828
-sie 9765
-ens 9748
-iss 9720
-ech 9665
-age 9654
-uro 9599
-ege 9590
-euro 9587
-rr 9562
-übe 9493
-unge 9415
-nn_ 9394
-rop 9378
-über 9368
-rk 9358
-erde 9338
-oll 9332
-ngs 9308
-nu 9209
-cha 9204
-fo 9180
-se_ 9149
-id 9095
-dem 9078
-re_ 9002
-mme 9000
-urop 8958
-bes 8937
-auc 8928
-auch 8926
-ber_ 8914
-o_ 8870
-chl 8837
-ite 8774
-rn_ 8764
-wie 8744
-werd 8743
-est 8733
-ssen 8706
-nter 8660
-lu 8654
-nk 8640
-fa 8577
-tli 8577
-rä 8575
-lie 8522
-ati 8510
-err 8489
-all 8428
-eic 8416
-eich 8416
-de_ 8414
-ang 8405
-rt_ 8375
-nt_ 8299
-ff 8260
-schl 8163
-i_ 8150
-uch_ 8140
-rst 8116
-haf 8115
-du 8087
-gt 8076
-rec 8067
-ungs 8022
-eite 7997
-hm 7960
-ck 7951
-scha 7951
-tel 7937
-mei 7917
-ka 7900
-le_ 7866
-tte 7823
-rech 7777
-bi 7740
-hei 7712
-iti 7707
-rf 7705
-no 7695
-eri 7651
-ric 7646
-uns 7638
-rau 7623
-rich 7623
-ih 7603
-ins 7567
-tun 7559
-ene 7556
-wo 7534
-kei 7517
-ur_ 7503
-ssi 7480
-eren 7475
-fra 7472
-mein 7458
-ger 7447
-tra 7440
-mis 7426
-ern_ 7391
-oc 7386
-a_ 7372
-erst 7307
-rh 7303
-chaf 7284
-ede 7268
-ga 7267
-aft 7238
-uß 7212
-ende 7177
-iel 7166
-egen 7103
-fen 7065
-änd 7064
-igen 7063
-pro 7039
-hn 7028
-der_ 7026
-rag 7025
-lei 7007
-och 6998
-ei_ 6988
-alt 6974
-miss 6961
-rte 6958
-ef 6956
-pä 6944
-mmi 6906
-lte 6905
-nf 6894
-hal 6893
-mmen 6868
-at_ 6842
-gli 6829
-ied 6819
-sti 6809
-ame 6804
-haft 6775
-tlic 6768
-ommi 6728
-mmis 6726
-sio 6720
-sion 6719
-ord 6714
-ide 6691
-tä 6658
-opä 6650
-ropä 6650
-ns_ 6649
-po 6628
-enn 6618
-ik 6615
-ner_ 6612
-tw 6577
-sei 6568
-mu 6564
-äi 6563
-äis 6563
-eis 6560
-opäi 6560
-päi 6560
-päis 6560
-rge 6560
-ent_ 6559
-äisc 6557
-tung 6540
-hme 6533
-kl 6531
-tsc 6529
-tsch 6528
-lä 6458
-ebe 6450
-ehr 6443
-wen 6434
-nne 6401
-etz 6367
-lt_ 6366
-ann 6319
-hr_ 6308
-ls_ 6301
-hab 6292
-ing 6273
-ande 6235
-hu 6230
-rsc 6227
-rsch 6227
-sin 6215
-cher 6207
-erei 6198
-habe 6173
-echt 6161
-llen 6156
-ssio 6155
-ini 6144
-gt_ 6121
-als 6114
-rm 6102
-nden 6072
-ba 6060
-herr 6031
-ate 6027
-rbe 6007
-ehe 6006
-itt 6000
-ew 5994
-eme 5984
-rü 5955
-unt 5938
-for 5937
-lun 5917
-gu 5887
-lung 5880
-unte 5872
-ig_ 5865
-erh 5831
-rat 5816
-issi 5800
-ft_ 5799
-ue 5785
-z_ 5767
-k_ 5758
-ts_ 5757
-ment 5744
-iner 5724
-amen 5723
-mö 5699
-par 5693
-nsc 5686
-nsch 5685
-aben 5664
-ahr 5645
-eben 5612
-och_ 5610
-rd_ 5591
-ße 5586
-ter_ 5565
-ete 5558
-lit 5524
-zie 5522
-br 5506
-et_ 5496
-eil 5483
-era 5474
-nts 5467
-leg 5465
-hte_ 5461
-ents 5450
-ug 5447
-je 5443
-dar 5440
-sam 5429
-ek 5396
-nis 5392
-ät 5391
-spr 5383
-ien 5382
-ird 5359
-ele 5326
-fi 5315
-el_ 5311
-alle 5307
-ird_ 5305
-wird 5304
-str 5277
-gel 5254
-beit 5251
-os 5231
-ind_ 5206
-geb 5196
-atio 5190
-iden 5183
-sind 5182
-rla 5173
-imm 5169
-ffe 5162
-ehen 5148
-zw 5100
-tell 5092
-nse 5082
-ände 5079
-ange 5078
-hat 5052
-esc 5043
-esch 5039
-um_ 5038
-lan 5033
-stel 5024
-ere_ 5016
-bs 4996
-elle 4996
-tei 4978
-sol 4971
-rz 4969
-ant 4965
-nun 4947
-erf 4946
-ak 4942
-nst 4940
-hmen 4928
-heit 4926
-halt 4908
-erb 4886
-ar_ 4875
-zus 4862
-gem 4840
-zur 4837
-ob 4831
-äs 4808
-inen 4807
-kr 4803
-är 4803
-one 4779
-keit 4766
-egi 4754
-prä 4748
-olle 4747
-nac 4721
-rw 4719
-agen 4714
-nach 4711
-od 4705
-reic 4702
-hren 4698
-kon 4694
-enn_ 4681
-ert_ 4660
-fen_ 4659
-reg 4639
-ku 4630
-ort 4615
-vi 4609
-hä 4607
-ser_ 4595
-lo 4586
-us_ 4584
-bl 4580
-bere 4572
-her_ 4561
-pe 4537
-chu 4535
-lle_ 4520
-oli 4513
-org 4510
-zen 4503
-to 4501
-su 4496
-ho 4492
-ihr 4472
-uss 4459
-geh 4458
-dere 4457
-sten 4451
-eut 4444
-elt 4443
-tis 4437
-ann_ 4436
-vers 4432
-wic 4430
-tige 4426
-nnen 4412
-eric 4411
-zei 4407
-anz 4406
-ese_ 4397
-ran 4375
-rbei 4344
-ehr_ 4339
-arb 4336
-uß_ 4336
-rc 4331
-hie 4327
-if 4317
-kan 4316
-erw 4308
-aa 4304
-gun 4304
-pol 4302
-nie 4298
-dent 4297
-rin 4296
-ale 4294
-rage 4283
-hin 4273
-tg 4264
-arbe 4254
-do 4245
-erl 4241
-sein 4223
-iv 4215
-itte 4210
-onen 4201
-räs 4201
-präs 4199
-gung 4188
-rr_ 4187
-sid 4185
-ass 4184
-üh 4181
-lten 4180
-weit 4177
-ken 4173
-kti 4170
-err_ 4159
-ntr 4149
-äsi 4132
-lb 4126
-zun 4123
-ione 4119
-poli 4109
-dern 4104
-zt 4101
-eins 4084
-ds 4077
-lam 4065
-llt 4060
-arl 4058
-ntw 4058
-uni 4057
-geg 4056
-lag 4047
-räsi 4047
-äsid 4047
-enen 4036
-omme 4029
-tisc 4020
-han 4011
-ieru 4005
-ahm 4004
-side 4003
-inde 3998
-ll_ 3998
-aat 3972
-rch 3972
-aten 3967
-ess 3966
-ez 3966
-liti 3965
-gan 3963
-og 3959
-nung 3957
-art 3954
-olit 3951
-iten 3945
-geme 3943
-lame 3941
-son 3936
-arla 3933
-erg 3933
-parl 3930
-rlam 3929
-taa 3923
-urc 3923
-staa 3922
-taat 3922
-nser 3920
-dr 3916
-ors 3914
-tim 3914
-ahme 3907
-int 3900
-ihre 3891
-mo 3891
-ffen 3885
-dl 3883
-tre 3878
-an_ 3875
-wä 3871
-glic 3865
-mü 3857
-tze 3856
-kt_ 3842
-erk 3833
-inge 3830
-unse 3826
-üs 3811
-oh 3803
-ön 3800
-äh 3798
-hne 3797
-amm 3774
-b_ 3772
-ters 3770
-nh 3767
-nig 3767
-tzt 3758
-ige_ 3747
-set 3744
-ond 3741
-dur 3737
-tik 3735
-beri 3734
-mt 3729
-its 3728
-ja 3726
-schu 3722
-urch 3716
-of 3702
-setz 3701
-rit 3696
-durc 3691
-teil 3678
-sere 3674
-iede 3669
-age_ 3668
-kö 3660
-rer 3658
-nde_ 3657
-eits 3654
-stim 3651
-was 3645
-timm 3636
-deru 3618
-ib 3617
-or_ 3615
-üss 3615
-rie 3613
-tet 3613
-nat 3609
-iert 3593
-seh 3592
-chti 3590
-hti 3590
-acht 3585
-htig 3584
-sg 3566
-ein_ 3565
-ag_ 3564
-üsse 3562
-ach_ 3560
-me_ 3557
-inn 3548
-nio 3548
-öc 3542
-eser 3534
-nion 3532
-unio 3532
-öch 3531
-dig 3528
-gege 3527
-trag 3523
-wu 3518
-gru 3515
-ia 3485
-kön 3479
-akt 3459
-tie 3437
-att 3429
-ise 3419
-aft_ 3418
-ot 3416
-emei 3408
-tat 3407
-vors 3402
-bet 3401
-sh 3394
-lg 3390
-frag 3372
-ode 3372
-wenn 3372
-gew 3366
-auss 3362
-vie 3358
-fl 3357
-kann 3340
-gie 3338
-alte 3331
-ün 3330
-orde 3326
-ul 3326
-soll 3318
-inte 3317
-zen_ 3316
-könn 3312
-önn 3312
-erte 3309
-man 3304
-mitt 3300
-hts 3298
-pf 3293
-chts 3291
-ühr 3283
-rder 3280
-tü 3271
-ute 3263
-wor 3262
-etr 3254
-ndl 3254
-nah 3251
-füh 3243
-dn 3241
-hs 3241
-esse 3237
-res 3234
-tzu 3211
-öcht 3207
-möc 3206
-möch 3206
-iere 3205
-ien_ 3204
-y 3196
-itg 3193
-best 3186
-rli 3184
-chs 3176
-mer 3176
-ses 3164
-tät 3161
-eht 3157
-eht_ 3156
-ses_ 3153
-ahre 3151
-zung 3141
-hli 3137
-onde 3131
-rde_ 3119
-lem 3113
-rund 3108
-noc 3107
-sond 3107
-eid 3104
-war 3102
-stä 3098
-reit 3096
-nkt 3089
-chi 3083
-fin 3078
-chr 3075
-führ 3071
-etzt 3060
-chli 3056
-ler 3049
-regi 3047
-üc 3046
-noch 3039
-end_ 3034
-ick 3032
-th 3031
-weis 3030
-ör 3018
-wel 3017
-esen 3016
-grun 3011
-iter 3002
-erz 2992
-rer_ 2991
-müs 2979
-ekt 2977
-ans 2974
-rste 2974
-zum 2971
-eise 2965
-müss 2965
-neh 2964
-ersc 2961
-bed 2958
-tern 2957
-tiv 2957
-äg 2957
-este 2956
-eue 2952
-sel 2952
-ld 2945
-ona 2943
-teh 2938
-rts 2935
-ndi 2932
-eß 2928
-mitg 2924
-steh 2924
-orm 2921
-tet_ 2915
-tri 2909
-aber 2906
-dan 2904
-mens 2899
-län 2898
-ons 2894
-ehm 2889
-ina 2887
-nehm 2887
-lin 2886
-glie 2885
-lied 2883
-orge 2880
-ken_ 2877
-ntsc 2874
-nal 2871
+# NgramProfile generated at Tue May 31 01:07:10 CEST 2005 for Nutch Language Identification
+e 24652896
+n 15611142
+i 12802965
+r 11374332
+s 9441740
+t 8886091
+a 8004679
+d 7768321
+h 6372084
+u 6005969
+l 4973752
+g 4811272
+c 4199331
+m 4000350
+o 3960281
+b 2744574
+f 2494870
+w 2244793
+k 2023439
+z 1822194
+p 1741554
+v 1401339
+ä 1061638
+ü 1059062
+ß 509683
+ö 405808
+j 236853
+y 77740
+x 54666
+q 43636
+é 36843
+à6284
+è 5248
+á 2978
+à2543
+ê 2236
+ó 1950
+ô 713
+ç 672
+æ 659
+ò 404
+ñ 349
+ú 349
+î 335
+û 317
+ù 265
+â 248
+ã 242
+ø 223
+ï 155
+Ã¥ 103
+º 82
+ë 65
+ì 44
+õ 7
+ý 4
+ª 3
+ð 3
+µ 2
+n_ 6395150
+en 6132182
+er 5295250
+_d 4415409
+e_ 3991651
+ch 3910227
+r_ 3311961
+de 3285693
+t_ 2699856
+ie 2674778
+ei 2577151
+in 2421959
+un 2405456
+ge 2247087
+te 2170183
+s_ 1992167
+_e 1921838
+nd 1817256
+_a 1765735
+be 1751751
+es 1714189
+_s 1700523
+ic 1673586
+di 1637570
+_i 1624019
+he 1548678
+_w 1503599
+ng 1477721
+re 1447478
+st 1445018
+it 1313136
+ne 1310157
+_u 1296442
+an 1274655
+is 1220362
+se 1212461
+sc 1200925
+d_ 1200843
+h_ 1136134
+_b 1114420
+_v 1087003
+au 1070293
+on 1043866
+_m 1032452
+me 1003746
+_g 977132
+li 974542
+g_ 970519
+le 952593
+da 948399
+nt 944370
+ti 937457
+ht 925269
+si 924707
+_z 870422
+wi 845660
+zu 841216
+m_ 840762
+_p 829615
+ra 827036
+_n 814449
+_f 804054
+_h 790363
+ss 783713
+el 772605
+we 766500
+ha 753989
+al 737672
+_k 719017
+or 714199
+ns 686735
+at 683609
+ar 678522
+ll 653000
+mi 652366
+ni 648709
+ri 633751
+em 623037
+ur 619359
+as 617377
+ve 616643
+vo 609752
+rd 609459
+ig 582712
+us 570712
+rt 549342
+ir 546352
+hr 537606
+na 534788
+et 521196
+ro 507417
+eh 506451
+la 497058
+io 496756
+ts 490693
+u_ 469491
+rs 466750
+am 466300
+ru 463725
+eu 445028
+ke 442117
+tr 436665
+_r 435771
+eg 435075
+nn 433206
+mm 431562
+so 428755
+ol 428632
+ab 425752
+ko 424570
+pr 407487
+ag 404199
+_l 400949
+lt 400265
+ür 397243
+fü 379481
+uf 375261
+ta 362042
+l_ 360620
+sa 354995
+sp 344328
+im 331323
+fe 325158
+ed 321756
+ma 317992
+ze 316590
+um 316301
+om 315771
+id 313148
+tz 311485
+rn 308496
+hl 292359
+ft 285559
+kt 283307
+p_ 277718
+il 274969
+ac 272795
+_t 270331
+f_ 269878
+ah 265084
+gr 263389
+tu 261060
+ß_ 260802
+tt 256436
+fr 255976
+uc 255232
+hi 247766
+ut 245479
+eb 235279
+wa 234408
+rg 231608
+rl 230132
+aß 229644
+gl 225434
+op 225134
+af 222176
+pa 222082
+gs 220532
+üb 217396
+nz 216746
+ec 215352
+rb 213049
+än 207447
+rr 206096
+ls 205568
+tl 205378
+gi 203966
+rk 203433
+rä 201976
+zi 201076
+_j 200871
+pe 198298
+fo 197803
+ak 195775
+i_ 189960
+nu 186071
+lu 185365
+a_ 184111
+du 183533
+fa 183329
+ff 183276
+gu 183196
+_ü 176365
+nk 174268
+no 174019
+_o 173977
+gt 169847
+o_ 167390
+hm 165018
+ck 162440
+ga 161171
+bi 159192
+oc 157110
+ih 156687
+wo 156317
+rh 155985
+rf 155732
+ka 153458
+po 151814
+ef 149631
+hn 147894
+pä 147736
+tä 143839
+nf 142647
+ea 142213
+mu 139510
+äi 138627
+ue 137614
+hu 135984
+lä 134464
+kl 133054
+tw 131604
+äs 131256
+ba 130590
+ik 129272
+k_ 128952
+rü 128039
+rm 127515
+ew 127250
+z_ 121915
+fi 120885
+br 118415
+ße 117719
+mö 115626
+je 114973
+ät 114605
+ek 111511
+su 110710
+os 110604
+zw 110246
+uß 110107
+kr 109429
+to 105774
+rz 104194
+bl 104160
+ug 103708
+lo 103529
+ob 102868
+bs 101762
+ku 101669
+vi 100013
+är 99153
+ho 96406
+od 96150
+if 95585
+rw 95427
+rc 95213
+hä 93578
+iv 92198
+üh 91144
+tg 90467
+zt 89801
+do 89733
+aa 89512
+dr 88309
+wä 87035
+ua 86342
+mo 85205
+lb 85105
+ds 84063
+ez 83088
+og 82786
+ön 82363
+wu 82210
+dl 81782
+b_ 81504
+nh 80508
+äh 80287
+üs 79617
+ib 79343
+ot 79066
+mü 79064
+oh 78972
+ja 78465
+_c 78152
+of 77223
+kö 76889
+ia 74753
+ul 74648
+lg 74264
+mt 73873
+ün 72800
+sh 72374
+sg 71632
+öc 69562
+tü 69405
+pf 69297
+fl 66854
+th 65935
+hs 64142
+üc 62161
+äg 61859
+_ä 61830
+ör 61591
+mp 61477
+sb 61316
+ld 60834
+nb 58556
+dn 56260
+uk 55289
+ög 54821
+eß 54331
+hö 54151
+gk 53821
+pi 53760
+fu 53514
+oz 50941
+sm 50890
+üt 50679
+pu 50542
+hw 49778
+pl 49719
+bt 49403
+ub 49393
+sw 49346
+ok 48468
+sk 48259
+ad 48123
+ms 47484
+ln 47410
+iz 47342
+pt 46400
+nw 46387
+nl 46335
+wü 45607
+sl 45405
+äc 43959
+ep 43689
+qu 42533
+bu 42273
+ks 42122
+nä 41988
+nr 41867
+ow 41716
+sv 41526
+nm 41121
+fg 39801
+fä 39705
+nv 39594
+bü 39207
+äl 39195
+lc 39112
+lf 39046
+ex 38392
+ßt 38204
+oß 38126
+äu 37939
+sf 37830
+gn 37634
+bg 37132
+hk 37005
+lk 36371
+äf 35270
+äm 35012
+rp 34829
+üg 34738
+ee 34416
+ou 34330
+bo 34081
+ap 33920
+pp 32412
+up 32409
+ös 32394
+za 31641
+sr 31290
+sä 31222
+ßn 30999
+ev 30476
+sy 30450
+ai 30187
+co 29912
+tn 29865
+eo 29660
+mä 29629
+_ö 29010
+ys 28968
+iß 28498
+tb 27794
+az 27572
+ce 26982
+ip 26978
+va 26975
+ki 26441
+öl 25887
+rö 24940
+mb 24573
+öf 24456
+kü 24185
+_q 23896
+lö 23263
+nü 23231
+lü 23068
+rv 22786
+mw 22664
+ju 22662
+ml 22235
+nc 21944
+av 21150
+uh 20884
+sz 20723
+vö 20287
+tf 19991
+fs 19484
+ud 19211
+fö 19008
+ph 18834
+v_ 18831
+zl 18535
+äß 18105
+sd 18015
+zo 17649
+zü 17497
+ßl 17156
+ca 16984
+lm 16928
+fn 16515
+go 16393
+dw 16364
+öß 15963
+tv 15957
+bk 15889
+xi 15656
+öh 15613
+ov 15394
+ßu 15282
+dü 15257
+ui 15131
+kä 14987
+üß 14893
+kz 14716
+üf 14558
+dh 14429
+oo 14427
+ül 13980
+bz 13862
+y_ 13837
+bn 13725
+tp 13696
+np 13440
+mf 13409
+xt 13386
+bw 13172
+hz 13169
+hg 13054
+bh 12936
+dt 12919
+hü 12123
+tm 11986
+c_ 11451
+lp 11412
+w_ 11269
+dp 11118
+uz 10851
+sn 10533
+gü 10492
+lz 10436
+hf 10382
+fz 10268
+oj 10230
+lr 10132
+hh 9946
+ci 9851
+hb 9659
+äd 9375
+uw 9157
+mg 9137
+sü 9077
+iu 8887
+hd 8482
+oi 8417
+gä 8372
+x_ 8349
+fb 8335
+kw 8275
+öt 8201
+ßb 8150
+ßi 8006
+zö 7915
+ps 7805
+lv 7740
+uv 7659
+ae 7498
+nö 7437
+fm 7187
+mk 7174
+é_ 7099
+oe 7066
+gf 7004
+cu 6873
+ly 6852
+tö 6769
+gh 6685
+xp 6615
+ré 6511
+sö 6455
+ii 6365
+dg 6273
+zg 6207
+à_ 6189
+üd 6007
+gg 5725
+kh 5712
+tk 5633
+yl 5597
+eq 5575
+kg 5508
+_à5460
+kk 5431
+jo 5402
+ux 5401
+ct 5397
+xe 5335
+eä 5327
+lh 5323
+ök 5133
+yp 5124
+té 5122
+dä 5091
+jä 5024
+ax 4962
+kn 4845
+ey 4840
+aw 4760
+km 4718
+cr 4707
+bä 4691
+yn 4676
+zz 4663
+ej 4657
+gb 4645
+lw 4582
+df 4527
+md 4496
+_é 4492
+és 4431
+td 4370
+dm 4284
+uo 4270
+dé 4267
+ay 4216
+ij 4049
+zb 4009
+kb 4008
+bf 4006
+zs 3965
+db 3880
+zm 3877
+wt 3850
+öd 3781
+bb 3693
+oa 3654
+iw 3620
+ér 3598
+mz 3560
+wö 3548
+ée 3546
+jü 3531
+iq 3525
+zf 3486
+cl 3478
+mn 3456
+zy 3441
+yo 3396
+zä 3358
+fw 3305
+cc 3283
+fh 3271
+ye 3048
+ox 3046
+hy 3035
+zd 3026
+ßf 2994
+ty 2974
+ry 2957
+rj 2909
+kp 2893
+ym 2830
+bj 2817
+gm 2789
+ét 2780
+éc 2692
+oy 2690
+äe 2579
+by 2578
+pé 2578
+nj 2572
+dy 2561
+öm 2551
+yr 2511
+hv 2509
+dd 2452
+äz 2393
+sj 2363
+zn 2343
+mc 2339
+sq 2336
+zk 2307
+bv 2249
+uu 2249
+öp 2242
+gz 2168
+ky 2165
+fk 2159
+gv 2143
+dz 2132
+mé 2106
+iö 2054
+üm 2041
+_y 2035
+èr 2035
+lé 1975
+mr 1922
+j_ 1910
+xu 1905
+gö 1889
+né 1886
+ég 1876
+ya 1871
+ao 1836
+bö 1836
+äv 1824
+zp 1819
+gw 1818
+vr 1812
+bd 1795
+kf 1759
+iè 1746
+üp 1745
+sé 1676
+ßa 1658
+dv 1607
+zr 1565
+én 1554
+pü 1551
+cn 1530
+äb 1515
+gd 1512
+ál 1497
+ßv 1488
+dk 1473
+ßs 1443
+ón 1442
+êt 1438
+év 1435
+xa 1424
+hp 1420
+my 1420
+ws 1417
+él 1407
+vp 1325
+rq 1292
+rè 1282
+dö 1276
+ix 1275
+mh 1270
+wg 1270
+yt 1225
+fv 1218
+ès 1212
+zh 1187
+oö 1184
+éd 1181
+tc 1164
+ró 1124
+ßg 1112
+fp 1108
+ÃÂÂn 1103
+ww 1099
+eü 1087
+án 1083
+yc 1072
+wh 1056
+zv 1052
+kv 1041
+ép 1039
+mv 1028
+ny 1020
+ém 998
+zá 983
+cy 961
+jö 941
+gy 925
+cq 915
+ßz 910
+hj 901
+vé 890
+ié 883
+aj 879
+hé 871
+yi 865
+èm 862
+_ê 860
+lè 858
+_x 840
+ßr 833
+cd 826
+aq 824
+lj 819
+yk 814
+ué 805
+gp 793
+vs 785
+ÃÂÂa 779
+uy 770
+js 764
+uj 737
+rà733
+qv 707
+jk 705
+pö 705
+uü 703
+dc 701
+gé 680
+py 680
+fé 678
+nq 665
+jt 657
+éf 653
+cs 643
+êm 642
+bé 637
+éa 637
+uq 629
+ji 628
+wj 622
+vv 620
+wy 616
+lq 595
+zq 594
+wl 590
+ßh 590
+vb 579
+äq 575
+mê 572
+tà565
+vu 561
+ßm 550
+uä 544
+_á 527
+èg 525
+tq 518
+dq 517
+cé 516
+yg 507
+ßk 478
+cà476
+wr 474
+éb 467
+cm 461
+ßc 461
+kd 460
+ná 449
+vc 436
+wm 435
+xz 434
+yb 432
+dj 424
+æk 411
+bæ 408
+pk 408
+iä 406
+eö 401
+ßp 385
+sá 384
+pc 378
+éo 376
+xc 370
+wf 360
+jn 354
+vä 354
+éj 353
+öv 352
+gj 351
+éq 351
+vl 346
+kj 345
+fd 336
+yd 336
+dà333
+ça 332
+aä 330
+rê 324
+pv 322
+tj 315
+ôt 307
+bc 306
+ó_ 305
+rô 300
+là299
+bm 296
+tê 294
+ôl 294
+kx 289
+aî 288
+jà287
+hq 283
+má 282
+fj 280
+q_ 278
+ÃÂÂ_ 271
+vm 264
+öw 264
+ù_ 258
+où 257
+tè 255
+ún 251
+oq 246
+sò 246
+òl 246
+cú 243
+ão 240
+aç 238
+ßw 234
+só 233
+ær 233
+hc 232
+jæ 231
+xx 231
+pm 218
+ço 217
+ÃÂÂe 217
+öö 215
+xo 211
+fc 209
+wn 204
+ît 200
+cô 198
+sà195
+ør 190
+ût 190
+éu 189
+pn 184
+añ 180
+cè 177
+oû 173
+dè 172
+vg 167
+äa 167
+vk 165
+yu 164
+xk 163
+èt 153
+gq 151
+jø 149
+yh 149
+äp 149
+pè 148
+cò 147
+ò_ 147
+nç 146
+rç 146
+öo 146
+fy 144
+ló 144
+hè 141
+cp 136
+óp 132
+öb 132
+ä_ 131
+cb 130
+ßä 130
+âc 129
+ár 126
+ño 126
+á_ 125
+èd 123
+mè 119
+ñe 119
+xy 118
+în 117
+cf 116
+pj 115
+tx 114
+tà111
+vd 111
+nè 109
+ö_ 109
+aï 106
+èn 106
+bp 105
+yy 105
+ió 103
+pê 103
+vn 102
+êc 102
+pd 100
+là98
+iã 96
+iñ 87
+xé 87
+tá 86
+xv 86
+äy 86
+xh 85
+zc 85
+hô 84
+qa 84
+èv 84
+mj 83
+tó 82
+_º 80
+tô 80
+rx 79
+cg 75
+rà75
+pg 74
+vt 74
+wk 73
+èl 72
+iy 71
+kc 71
+éh 71
+ña 71
+º_ 69
+às 69
+ïr 69
+ûr 69
+sû 67
+xf 66
+ât 64
+ôm 62
+wd 61
+äk 61
+rã 60
+zj 60
+iü 59
+_ó 58
+râ 58
+tâ 58
+yé 57
+ßd 57
+zó 56
+gè 53
+rá 52
+éi 52
+dû 51
+vè 51
+çu 51
+cj 50
+mã 50
+eç 49
+fq 49
+lá 49
+vf 49
+bâ 48
+ÃÂÂg 48
+aé 47
+èc 47
+û_ 47
+oñ 46
+uà46
+cw 44
+mà44
+_ç 43
+çi 43
+_Ã¥ 42
+uè 42
+aà41
+wp 41
+yz 40
+yá 39
+gc 38
+mó 37
+sè 37
+äj 37
+Ã¥_ 37
+jd 36
+jm 36
+ÃÂÂs 36
+Ã¥r 35
+eå 34
+wc 34
+xq 33
+ël 33
+ác 32
+ái 32
+ï_ 31
+uê 30
+yw 30
+ôn 30
+oî 29
+rú 29
+äo 29
+_â 28
+fè 28
+mq 28
+ßo 28
+éé 28
+wb 27
+ü_ 27
+cv 26
+_ì 25
+pb 25
+vh 25
+vê 25
+ñi 25
+sø 24
+ÃÂÂo 24
+uç 23
+xs 23
+en_ 4444007
+er_ 2162347
+_de 1852571
+ich 1605741
+der 1468786
+_di 1465746
+die 1437381
+ie_ 1415417
+sch 1197384
+ein 1141617
+ch_ 1121051
+_un 1108454
+ung 1040980
+che 970689
+den 954916
+nd_ 933736
+_da 888446
+_be 853313
+cht 853077
+gen 801732
+und 800164
+_ei 766039
+es_ 759231
+in_ 720591
+ng_ 719870
+ten 711809
+_au 707637
+_wi 652361
+_zu 644821
+_ge 641933
+_in 634229
+hen 625110
+nde 593360
+on_ 591518
+ine 588101
+eit 587984
+_vo 543213
+ver 535538
+ent 510951
+ber 501215
+ere 499227
+men 488093
+ht_ 483946
+_we 480565
+wir 474197
+ion 471825
+lic 470823
+_si 466311
+te_ 459842
+_ve 451059
+it_ 437983
+ter 436062
+nen 431555
+nge 418273
+ste 395241
+isc 393683
+rde 384611
+das 383262
+ese 371294
+_mi 370217
+_an 364293
+ren 362511
+zu_ 358481
+ne_ 354896
+_er 353355
+em_ 351372
+her 350808
+as_ 349060
+_ha 347640
+ist 346825
+st_ 345223
+mit 342207
+ies 339725
+lle 338759
+_ko 335907
+run 335285
+auf 330568
+aus 327357
+ers 326989
+rei 298456
+ier 298085
+sen 297373
+nte 294757
+sse 293441
+_so 292807
+ir_ 284415
+ge_ 284357
+für 279471
+_fü 278759
+ben 277057
+des 276729
+he_ 274472
+vor 272397
+ür_ 272391
+ige 272127
+end 271867
+bei 269989
+and 268642
+von 267033
+ern 266439
+_ic 263371
+_p_ 261055
+ges 260170
+ach 257752
+_pr 255553
+_is 254280
+wer 253760
+_ni 251688
+_na 248390
+age 247140
+_se 246043
+_al 245909
+_st 245701
+abe 239624
+ame 239285
+ert 238159
+sic 237731
+omm 235418
+len 235039
+uch 235016
+tio 232983
+nic 228058
+eru 226956
+ang 225489
+_es 224968
+_eu 224353
+wei 224313
+_re 224169
+ind 221487
+kom 221099
+_he 220595
+erd 220466
+uf_ 217880
+sta 216302
+tig 214221
+eur 212426
+ner 207475
+nt_ 206894
+ell 205726
+hte 204496
+de_ 204340
+hre 203894
+übe 202837
+iss 202824
+uro 202095
+re_ 201760
+ens 201262
+ass 200604
+_fr 200532
+_im 200120
+ege 200104
+sie 199995
+_me 199241
+bes 197029
+_en 196465
+dem 196457
+um_ 195920
+_ab 195471
+ser 195128
+nn_ 194847
+rop 194838
+mme 193360
+ati 193165
+se_ 192705
+chl 192704
+est 192695
+ite 192663
+oll 192375
+auc 189276
+ngs 187621
+ech 187198
+cha 187063
+_sc 185759
+rn_ 183660
+rt_ 180801
+err 180448
+aß_ 179700
+im_ 179121
+lie 178939
+wie 177755
+_üb 176211
+daß 174800
+eri 174158
+le_ 173875
+all 172672
+an_ 172547
+rst 172253
+eic 172191
+ric 170676
+tli 170588
+iti 168688
+me_ 168292
+hei 167843
+mei 167248
+tte 165804
+ide 165763
+_ma 164238
+ss_ 163925
+tel 163498
+haf 162865
+ins 162784
+lan 161805
+ur_ 161622
+tra 161017
+at_ 158579
+ger 158425
+_um 156609
+rau 156345
+kei 155753
+ene 155353
+fra 154594
+mis 154103
+ede 153821
+uns 152696
+uss 151654
+ns_ 151398
+tun 151033
+rec 150488
+änd 149699
+fen 148848
+aft 148718
+ei_ 148454
+rag 147817
+iel 146835
+_sp 146742
+lei 146711
+pro 146126
+_la 145887
+ssi 145694
+och 145646
+sti 144671
+ied 144668
+alt 144109
+hal 144060
+sei 143909
+gli 143281
+rte 143110
+lte 141159
+ehr 140952
+opä 140921
+rat 139606
+äis 138610
+päi 138485
+lt_ 138463
+hr_ 138272
+rsc 137815
+nne 137769
+tsc 137514
+hme 137106
+_gr 136839
+hab 136678
+eis 136614
+mmi 135939
+enn 135430
+_wa 135394
+rbe 135261
+ing 134183
+ord 133720
+rge 133154
+eme 132872
+unt 132276
+wen 132250
+etz 132117
+sio 132104
+_pa 130831
+itt 130578
+ebe 130474
+for 130442
+ann 130019
+_ih 129705
+ls_ 129342
+ate 129114
+gt_ 128424
+rd_ 128410
+erh 127909
+sin 125388
+prä 125190
+ini 125142
+lun 124917
+_hi 124514
+als 123658
+nis 123243
+par 123143
+ts_ 123090
+lit 123038
+ehe 122941
+et_ 122760
+ker 122551
+spe 120793
+ft_ 120727
+ird 120522
+leg 118400
+el_ 117718
+sam 117259
+eil 117241
+ig_ 115864
+_le 115307
+sid 115152
+ien 114481
+zie 113986
+räs 113881
+ffe 113847
+str 113523
+hat 113468
+dar 113102
+nsc 112989
+äsi 112744
+ahr 112619
+nts 111442
+ele 111401
+gel 111113
+spr 109671
+nam 109661
+era 109456
+rla 109168
+_ra 107678
+ar_ 107618
+tei 107417
+imm 107185
+geb 106894
+esc 106794
+nse 106750
+ant 106365
+ete 104783
+_no 104314
+one 103836
+erf 103828
+gem 103652
+us_ 103385
+ort 103101
+zur 102885
+nst 102341
+sol 102062
+_mö 101020
+_id 100883
+kon 100117
+erb 99753
+oli 99266
+chu 99140
+zus 98858
+id_ 97977
+nun 97409
+elt 96217
+arb 96179
+eut 95791
+gun 95708
+zen 95572
+tis 95496
+nac 95476
+_je 95376
+ake 95321
+_zw 95295
+han 95038
+pol 94995
+_ar 93995
+ors 93581
+eak 93228
+zei 93084
+ran 92762
+ihr 92602
+_ka 92384
+hin 92148
+ale 92093
+rin 91492
+_bi 90980
+ess 90904
+geh 90675
+pea 90567
+_wo 90189
+org 90109
+so_ 88808
+egi 88457
+son 88386
+uni 88193
+erg 88060
+kti 87971
+lag 87694
+erl 87554
+ken 87263
+erk 87104
+_nu 87080
+rr_ 86986
+wic 86953
+lam 86681
+arl 86633
+hie 86503
+kan 86421
+erw 86328
+rch 85984
+geg 85766
+rit 85487
+llt 85444
+int 85219
+its 84980
+_fo 84530
+anz 84488
+tre 84487
+_po 84437
+rie 84224
+ntr 84163
+urc 83921
+nie 83775
+tzt 83225
+reg 83107
+gan 82269
+tze 81784
+ll_ 81636
+aat 81498
+_du 80915
+amm 80911
+dur 80796
+zun 80789
+taa 80403
+tim 80379
+ahm 80236
+ntw 78689
+ag_ 78560
+art 78427
+seh 78223
+tat 78167
+kt_ 78100
+ond 77364
+hne 77238
+nat 77227
+or_ 76809
+nig 76523
+tet 76336
+man 76210
+hti 76069
+tik 75933
+rer 75842
+_kö 75569
+set 75083
+inn 74803
+üss 74380
+nio 74022
+kön 73988
+mer 73515
+bet 73324
+gew 73248
+tie 73176
+res 73079
+_ne 72911
+akt 72783
+ise 72451
+_ja 72299
+ute 71960
+dig 71276
+att 71018
+önn 70481
+war 70247
+ons 70206
+_vi 69923
+ühr 69494
+was 69422
+_mu 69307
+vie 69114
+füh 69078
+öch 68985
+ses 68962
+ndl 68953
+tri 68814
+etr 68698
+wor 68693
+_mü 68426
+noc 68406
+tät 68380
+_ke 68288
+gru 67369
+ode 67317
+ans 67305
+itg 67168
+lem 67111
+ler 66956
+rli 66860
+rts 66357
+chr 66062
+stä 65869
+_te 65762
+is_ 65169
+eid 64944
+neh 64880
+_fi 64667
+hli 64382
+nah 64281
+erz 64101
+gie 64082
+wur 63953
+möc 63678
+ehm 63655
+eht 63614
+chi 63469
+ngu 63417
+fin 63001
+tiv 62884
+bed 62881
+itä 62879
+chs 62822
+hts 62796
+tzu 62673
+au_ 62649
+rke 62462
+tan 62226
+nal 62215
+_wu 62166
+dan 61904
+ndi 61689
+ona 61622
+be_ 61608
+zt_ 61552
+ekt 61184
+wis 61017
+zum 60981
+müs 60864
+wel 60552
+län 60325
+hau 60315
+sel 60271
+enz 60096
+orm 60088
+tgl 60040
+teh 59961
+eue 59858
+ble 59802
+usa 59682
+nkt 59422
+ick 58940
+dun 58871
+urd 58760
+_sa 58726
+sun 58709
+_fa 57697
+ik_ 57657
+ina 57509
+ris 57397
+rha 57219
+uß_ 57203
+gef 56867
+sit 56504
+rhe 56396
+hun 56350
+ali 56304
+rne 56258
+kte 56092
+_ze 55844
+abs 55691
+_tr 55678
+nem 55676
+nti 55609
+sem 55507
+jah 55448
+nnt 55420
+_fe 55413
+igt 55312
+_gl 55279
+nze 55262
+nur 54731
+ive 54330
+meh 54259
+lin 54113
+eig 53999
+del 53718
+fol 53445
+ank 53404
+ara 53242
+ück 53193
+chn 53077
+_ri 53053
+ust 52918
+san 52888
+hla 52825
+nz_ 52752
+il_ 52725
+_ga 52528
+olg 52412
+rac 52260
+gke 52233
+igk 52233
+nes 52204
+rtr 52089
+gra 51966
+sha 51951
+off 51794
+sag 51691
+tsp 51577
+mög 51343
+unk 51314
+jed 51293
+doc 51118
+neu 50788
+dam 50773
+irt 50757
+fal 50684
+sge 50679
+eso 50620
+nan 50554
+deu 50472
+_ta 50449
+zwe 50336
+ßen 50269
+ssc 50131
+kun 49928
+inf 49541
+chw 49472
+inz 48893
+htl 48863
+fer 48825
+ntl 48824
+fre 48822
+itu 48669
+bar 48631
+ena 48601
+ögl 48568
+enh 48449
+ieß 48130
+gua 48114
+_li 48067
+tes 47994
+_do 47986
+kol 47905
+_od 47863
+_dr 47648
+ill 47480
+al_ 47469
+eds 47456
+_gi 47271
+rdn 47161
+uag 47128
+rze 46931
+äge 46798
+net 46513
+uen 46424
+tz_ 46321
+bst 46262
+nke 46203
+mal 46081
+are 46030
+nsa 45980
+bt_ 45951
+ähr 45839
+lge 45695
+am_ 45654
+sbe 45427
+dst 45417
+gle 45296
+ili 45273
+rüc 45173
+gsa 45084
+bew 44948
+tro 44918
+igu 44809
+bez 44756
+usg 44619
+_lä 44450
+twi 44440
+erm 44430
+_br 44381
+bra 44355
+wäh 44250
+alb 44207
+opa 44129
+rre 44048
+min 43949
+bil 43918
+hri 43877
+gre 43657
+_kr 43613
+äch 43473
+rif 43463
+irk 43447
+ütz 43318
+_am 43219
+nsi 42976
+_mo 42840
+ani 42778
+ami 42757
+zug 42687
+_än 42682
+pre 42682
+ial 42638
+lau 42619
+fah 42593
+rwe 42512
+kra 42459
+lig 42380
+uer 42366
+_wä 42290
+fun 42246
+beg 42238
+_zi 42214
+uti 41994
+ieg 41915
+ckl 41902
+fte 41860
+dli 41847
+_ho 41660
+rfo 41620
+rti 41571
+eln 41569
+maß 41396
+obl 41352
+isi 41307
+ßer 41205
+sor 41202
+rob 41053
+lli 41028
+ewe 41024
+hru 40838
+lis 40732
+ema 40512
+stü 40309
+mus 40053
+din 40004
+_kl 39830
+mun 39799
+ret 39771
+pun 39709
+hst 39694
+trä 39592
+aue 39401
+mmt 39345
+gte 39343
+nzi 39018
+fe_ 38997
+ari 38851
+utz 38851
+per 38814
+rak 38732
+hrt 38728
+las 38689
+uße 38666
+ahl 38655
+lch 38526
+ät_ 38445
+ont 38376
+tän 38223
+mac 38160
+tur 38152
+lls 38148
+beh 38087
+hle 38073
+pie 37987
+chä 37969
+ck_ 37942
+vol 37832
+ats 37794
+bri 37711
+nhe 37659
+los 37645
+iff 37615
+bin 37539
+ssa 37462
+ndu 37404
+nzu 37283
+mmu 37065
+un_ 37007
+ark 36940
+chk 36832
+ieh 36806
+sat 36804
+rkt 36581
+ibt 36575
+mt_ 36497
+mar 36482
+tüt 36457
+rle 36439
+heu 36411
+nha 36385
+hl_ 36316
+fts 36268
+abg 36174
+räg 36114
+rig 36093
+rkl 36090
+ufg 36026
+uge 35933
+rfa 35904
+fes 35774
+gro 35755
+muß 35705
+ven 35624
+da_ 35569
+klu 35532
+ltu 35342
+egt 35335
+lb_ 35199
+hke 35023
+sow 34901
+elb 34864
+fti 34640
+tor 34535
+edi 34504
+ut_ 34424
+fas 34225
+zwi 34218
+kri 34198
+rga 34194
+bge 34158
+rs_ 34129
+roß 33980
+_ak 33807
+nom 33692
+bür 33658
+pra 33397
+tru 33324
+_wü 33319
+nve 33268
+spi 33088
+stu 33062
+esa 33044
+eni 32903
+els 32805
+egr 32764
+äre 32719
+bli 32656
+ori 32588
+rog 32565
+ukt 32558
+hör 32441
+kli 32309
+eng 32184
+det 32183
+soz 31969
+mat 31963
+äft 31913
+wür 31795
+nsp 31708
+aff 31698
+ln_ 31696
+tin 31695
+_bü 31584
+htu 31536
+pri 31459
+ozi 31446
+tag 31317
+ürd 31268
+weg 31202
+ihn 31003
+woh 30978
+ßna 30973
+gs_ 30943
+äng 30927
+_et 30876
+aßn 30857
+gib 30857
+tem 30845
+ram 30776
+hlu 30652
+zia 30528
+les 30500
+kla 30457
+_ob 30392
+sar 30383
+grü 30370
+pa_ 30361
+enk 30335
+fri 30266
+sst 30264
+tit 30178
+ürg 30114
+hem 30073
+tär 30066
+edo 30055
+ref 30050
+ral 30030
+rma 29981
+ftl 29922
+itr 29843
+nft 29809
+two 29805
+_eb 29787
+eha 29712
+ogr 29671
+ewi 29656
+nfa 29637
+rol 29512
+mpf 29506
+eu_ 29443
+twe 29393
+tür 29253
+rbr 29212
+oße 29201
+rrn 29192
+agt 29185
+ue_ 29107
+nds 29076
+let 28972
+ohl 28901
+rum 28889
+rdi 28882
+dis 28718
+wär 28622
+the 28513
+örd 28487
+dnu 28479
+ile 28250
+bie 28053
+swe 27953
+_ba 27920
+tge 27856
+mic 27782
+om_ 27755
+bek 27614
+_pe 27564
+pfe 27360
+spo 27240
+_gu 27230
+ezi 27141
+wes 27029
+eff 26994
+ush 26935
+ike 26924
+bis 26884
+tt_ 26831
+leb 26776
+izi 26723
+iet 26648
+rem 26641
+suc 26624
+häf 26610
+rme 26605
+hof 26600
+llu 26596
+eih 26551
+eib 26491
+ze_ 26453
+eno 26445
+_nä 26353
+inb 26330
+atz 26324
+ätz 26173
+ibe 26150
+bef 26147
+erp 26102
+amt 26014
+jet 25986
+dri 25967
+gab 25902
+hil 25881
+fli 25812
+ieb 25780
+itz 25742
+_ku 25741
+rna 25678
+okr 25669
+efü 25663
+lts 25598
+zte 25582
+cke 25569
+ehö 25484
+emo 25416
+ohn 25392
+ums 25340
+hwe 25303
+ost 25289
+ruc 25279
+mil 25233
+nit 25202
+rah 25187
+zah 25180
+hus 25112
+nwe 25065
+eif 25046
+ast 24989
+ika 24917
+auß 24874
+gut 24864
+_th 24859
+_ch 24832
+eug 24807
+aub 24781
+spa 24636
+nma 24631
+nfo 24522
+lbs 24446
+ve_ 24340
+lfe 24204
+nar 24200
+_or 24192
+gio 24182
+tal 24176
+tst 24158
+mte 24137
+nbe 24027
+ett 24019
+wah 24009
+owi 23977
+esu 23971
+ppe 23915
+lar 23909
+cho 23866
+ume 23831
+_qu 23791
+osi 23726
+not 23590
+rwa 23558
+öff 23472
+esh 23469
+ßt_ 23459
+rku 23394
+_die 1414394
+der_ 1100668
+die_ 1076194
+_der 986312
+_ein 739562
+den_ 724809
+und_ 709790
+_und 690386
+ung_ 668671
+ich_ 663458
+ten_ 620775
+gen_ 576066
+eine 569519
+icht 559451
+hen_ 545656
+chen 501652
+sche 474049
+lich 456426
+_ver 447664
+_wir 438710
+_in_ 427834
+cht_ 413543
+nen_ 400126
+isch 393055
+_den 384159
+_das 382759
+_zu_ 331551
+dies 323789
+iche 293099
+ion_ 289590
+iese 287328
+nder 282450
+_auf 281443
+rung 271435
+für_ 271296
+_mit 268791
+ine_ 266583
+das_ 265018
+von_ 264873
+ren_ 263640
+_ich 262710
+ngen 258992
+wir_ 258856
+ist_ 256006
+_von 255329
+_für 251175
+che_ 249542
+_ist 247389
+men_ 246097
+_des 244476
+rden 237725
+sich 237617
+_vor 235409
+tion 232788
+eit_ 230123
+des_ 227591
+nich 226748
+sen_ 226072
+_nic 225444
+_aus 223944
+_es_ 218267
+auf_ 216415
+len_ 216270
+ben_ 211993
+erun 207589
+chte 203376
+komm 202300
+euro 201557
+unge 200823
+ein_ 200587
+_wer 200243
+über 199900
+ber_ 197853
+_eur 197235
+mit_ 196738
+erde 195895
+nter 190591
+auch 188870
+urop 187832
+werd 185372
+_sch 184790
+_ber 179300
+schl 178220
+ssen 176656
+_kom 174817
+daß_ 174800
+_daß 174794
+uch_ 173896
+eite 172782
+eich 172180
+_im_ 169849
+rich 169239
+_sic 168296
+dem_ 165959
+_übe 165381
+_her 164651
+_dem 163398
+ent_ 163305
+scha 162248
+ungs 160559
+_auc 159205
+mein 156592
+erst 155338
+_bes 154059
+_sie 153802
+ern_ 152107
+eren 151986
+_bei 151225
+ende 150443
+egen 149023
+chaf 148312
+igen 147893
+sie_ 147364
+_uns 145962
+mmen 145919
+rech 145038
+miss 143161
+ropä 140914
+tlic 139355
+_ent 138582
+päis 138484
+opäi 138480
+äisc 138427
+rsch 137811
+tsch 137499
+ande 137379
+haft 136516
+iden 136165
+_ges 135920
+cher 135531
+ner_ 134953
+_fra 134892
+erei 134278
+habe 134130
+ommi 132213
+mmis 132115
+sion 131860
+unte 130638
+_hab 130623
+tung 130135
+_wie 128220
+herr 128140
+nden 127704
+ment 127469
+llen 125454
+_unt 124483
+lung 123706
+amen 122618
+aben 122610
+age_ 122562
+atio 121353
+wie_ 121001
+ter_ 120626
+ssio 120584
+wird 120347
+ird_ 120346
+_all 119720
+_sei 119493
+ass_ 117973
+beit 117874
+dass 117457
+och_ 117242
+iner 116725
+dent 116706
+_sin 116017
+präs 113844
+echt 113221
+nsch 112798
+eben 112389
+_hat 112022
+issi 111100
+ents 110751
+äsid 110703
+räsi 110701
+side 110538
+ände 110211
+ange 107861
+alle 107810
+elle 107503
+name 107408
+heit 107142
+_als 106352
+esch 106305
+tell 106234
+_nam 106062
+ere_ 105959
+ind_ 105761
+sind 105753
+_prä 105411
+ehen 105156
+stel 103971
+halt 103868
+_par 103377
+inen 103233
+ame_ 102977
+hte_ 102567
+eric 102380
+hmen 102267
+_pro 101224
+_spe 100768
+_dar 100600
+ker_ 100475
+_wei 99779
+hat_ 99455
+als_ 99262
+agen 99226
+_zur 98579
+ert_ 98460
+rbei 97373
+olle 96777
+fen_ 96260
+ehr_ 96068
+keit 95962
+enn_ 95824
+tige 95456
+nach 95209
+arbe 94825
+_sol 94406
+her_ 94295
+_id_ 94254
+_um_ 94241
+nnen 94143
+lle_ 94112
+hren 93735
+dere 93669
+sein 93468
+gung 93037
+reic 93028
+sten 92862
+bei_ 92662
+_ihr 92576
+_lan 92491
+weit 92451
+bere 92199
+ann_ 91481
+vers 91245
+aker 91013
+spea 90174
+peak 90149
+eake 90138
+beri 89785
+_mei 89733
+poli 89563
+_wen 89440
+ser_ 89287
+eins 89124
+itte 88026
+_nac 87326
+onen 87269
+tisc 86877
+ffen 86784
+err_ 86740
+rage 86116
+omme 85932
+liti 85878
+olit 85808
+ese_ 84980
+_an_ 84943
+zur_ 84862
+ione 84827
+geme 83886
+ters 83603
+iten 83539
+lten 83275
+parl 83142
+dern 83031
+_kon 82997
+eits 82968
+aten 82479
+lame 82460
+arla 82269
+rlam 82061
+schu 81757
+glic 81060
+enen 80620
+inge 80578
+teil 80408
+staa 80390
+taat 80390
+lang 80299
+ihre 80247
+urch 80123
+nde_ 79842
+durc 79484
+nser 78569
+ahme 78490
+iede 78363
+ige_ 78198
+_sta 77915
+inde 77723
+vors 77640
+ieru 77444
+aus_ 77203
+nung 76823
+trag 76469
+chti 76042
+htig 75886
+unse 75871
+acht 75799
+auss 75476
+deru 74438
+gege 74341
+_gem 74293
+setz 74021
+_kön 73973
+stim 73909
+nion 73697
+unio 73614
+timm 73392
+_zus 73350
+_dur 73286
+_ste 73163
+_uni 73100
+sere 72940
+iert 72895
+emei 72625
+ach_ 72046
+orde 71695
+üsse 71262
+inte 71128
+zen_ 70755
+könn 70401
+wenn 70316
+esse 69536
+orsc 69319
+best 69075
+eser 68827
+rde_ 68528
+ses_ 68466
+aft_ 67895
+iere 67741
+kann 67726
+iter 67589
+hand 67454
+frag 67140
+noch 66930
+_ang 66829
+tern 66812
+rder 66739
+uns_ 66735
+mitt 66727
+_rec 66717
+este 66574
+ien_ 66545
+etzt 66393
+alte 66381
+_reg 66033
+_rat 65835
+soll 65796
+onde 65666
+_abe 65607
+_bet 65496
+führ 65432
+sond 64927
+was_ 64170
+erte 63949
+öcht 63710
+_möc 63678
+möch 63678
+nehm 63605
+aber 63518
+eht_ 63516
+_geg 63149
+esen 62958
+vor_ 62687
+chts 62684
+ahre 62652
+chli 62598
+_hin 62509
+tet_ 62465
+reit 62451
+_noc 62379
+_vie 62247
+schr 61792
+mitg 61773
+ens_ 61717
+_kan 61266
+rer_ 61199
+rund 61005
+end_ 60933
+lied 60915
+glie 60882
+eise 60820
+zung 60476
+_müs 60462
+müss 60459
+_so_ 60146
+lege 59902
+itgl 59839
+ersc 59807
+tgli 59772
+_and 59687
+rste 59636
+_zum 59621
+steh 59438
+ntsc 59430
+_int 59325
+weis 59308
+aate 59261
+_for 58782
+amme 58733
+zeit 58468
+vert 58446
+ache 58407
+dung 58347
+gesc 58243
+tzt_ 57855
+ken_ 57792
+leic 57772
+grun 57685
+rtsc 57654
+_seh 57476
+urde 57306
+_wur 57169
+ehme 57042
+eder 56644
+land 56639
+and_ 56373
+wurd 56322
+_man 56263
+viel 56131
+verb 56007
+nahm 55945
+isse 55803
+ktio 55496
+tig_ 55447
+_arb 55375
+orge 55369
+jahr 55219
+_dan 54856
+ger_ 54768
+tzun 54630
+nur_ 54616
+_nur 54510
+inne 54510
+zum_ 54429
+rch_ 53923
+_was 53866
+önne 53827
+mehr 53524
+sem_ 53468
+tzen 53463
+betr 53366
+ziel 53236
+eten 53193
+itik 53168
+_ins 53167
+ität 53167
+gese 53160
+lage 53131
+_bed 53073
+nem_ 52974
+akti 52924
+_pol 52855
+chla 52640
+esem 52630
+regi 52605
+_kei 52363
+folg 52319
+inem 52296
+gkei 52226
+igke 52225
+kein 52196
+schi 52137
+mens 51948
+hung 51664
+_jah 51522
+atte 51494
+rlic 51489
+_ers 51428
+ertr 51360
+länd 51209
+_jed 51143
+elt_ 51120
+erne 51075
+doch 51015
+rach 50996
+gest 50983
+frau 50851
+oder 50844
+zusa 50664
+wirt 50545
+samm 50261
+ensc 50260
+ssch 50129
+_gew 50038
+erha 49865
+ier_ 49780
+entw 49779
+gend 49517
+deut 49333
+tier 49295
+onal 49151
+llte 49093
+ttel 48896
+sehr 48790
+chtl 48779
+ritt 48751
+rten 48729
+tik_ 48604
+ford 48578
+mögl 48564
+ögli 48564
+shal 48470
+nten 48459
+htli 48434
+_meh 48220
+iste 48141
+form 48065
+nige 47937
+unkt 47857
+stan 47675
+_ode 47612
+asse 47495
+irts 47424
+ieds 47421
+hlag 47415
+angu 47334
+usam 47261
+entl 47225
+besc 47193
+_gru 47178
+ordn 47131
+ngua 47130
+uage 47125
+guag 47092
+eden 47043
+_geb 46979
+iona 46798
+ussc 46637
+stat 46600
+alen 46582
+_erf 46536
+hre_ 46492
+nati 46478
+wort 46105
+_hie 46071
+tte_ 46043
+eini 45963
+ließ 45956
+verf 45946
+hten 45850
+inie 45817
+hier 45697
+inig 45681
+_abs 45567
+chei 45496
+_zwe 45460
+nes_ 45263
+schw 45224
+wich 45152
+ise_ 45125
+ndig 45032
+antr 45008
+_geh 44986
+gele 44941
+ollt 44905
+eute 44758
+eil_ 44746
+ntli 44697
+ngsa 44665
+_gen 44585
+ies_ 44581
+ausg 44574
+_nat 44537
+man_ 44480
+ines 44370
+glei 44198
+_war 44048
+tere 43923
+imme 43920
+fall 43910
+hlie 43852
+ropa 43808
+offe 43564
+iele 43550
+igun 43392
+wend 43385
+koll 43382
+rati 43270
+_fin 43243
+zwei 43234
+dsta 43208
+itis 43090
+edst 43020
+_neu 42973
+_dam 42744
+ions 42642
+ndel 42606
+eses 42573
+wirk 42560
+rück 42420
+fahr 42291
+_änd 42288
+tive 42266
+tes_ 42008
+_gel 41876
+wick 41795
+_str 41737
+_ger 41541
+ente 41495
+dlic 41479
+gene 41413
+chri 41266
+_hau 41157
+welt 41134
+sant 41088
+_ric 41049
+tand 40914
+twic 40872
+lleg 40871
+ntwi 40870
+vorg 40819
+lte_ 40725
+hrun 40698
+haus 40604
+tens 40534
+gebe 40477
+_beg 40381
+sse_ 40299
+rein 40281
+_men 40253
+renz 40122
+ler_ 40109
+erhe 40056
+rau_ 39976
+ute_ 39905
+rat_ 39886
+erer 39874
+nale 39683
+_zei 39670
+erwe 39638
+hend 39629
+seit 39629
+beso 39528
+sier 39454
+prob 39441
+punk 39430
+eist 39416
+sung 39268
+_kol 39160
+rhei 39147
+_wic 39096
+chst 39080
+eleg 39077
+tatt 39071
+robl 38976
+_ans 38971
+neue 38950
+war_ 38926
+esti 38683
+rag_ 38579
+oble 38520
+blem 38270
+uss_ 38231
+ster 38211
+tänd 38079
+stän 38052
+schä 37914
+erfo 37894
+halb 37889
+ang_ 37826
+sch_ 37783
+iel_ 37617
+enti 37549
+inst 37395
+uen_ 37392
+eing 37389
+chie 37296
+_gef 37165
+eige 37030
+_mög 37021
+mmun 37010
+_län 36932
+mach 36767
+insc 36744
+abe_ 36709
+tät_ 36696
+_wel 36610
+ibt_ 36532
+ring 36517
+gehe 36453
+stüt 36440
+tütz 36440
+sser 36354
+rte_ 36312
+gsan 36194
+erge 36192
+eide 36137
+lche 36079
+_er_ 36033
+aufg 36026
+nte_ 36016
+dene 35948
+igt_ 35729
+_muß 35703
+rtei 35641
+lem_ 35537
+hnen 35533
+eson 35526
+_erw 35474
+ene_ 35468
+llt_ 35443
+nhei 35437
+uche 35381
+its_ 35295
+dara 35198
+alb_ 35190
+rate 35087
+_gro 35059
+chke 35021
+egie 34976
+ichk 34895
+_abg 34884
+erze 34867
+ntra 34733
+hkei 34718
+eche 34598
+träg 34545
+inan 34431
+rstü 34376
+_sow 34314
+erfa 34238
+äge_ 34228
+nkt_ 34188
+tehe 34176
+insa 34165
+muß_ 34149
+mer_ 34147
+abge 34132
+usge 34114
+_son 34045
+erre 34043
+groß 33966
+ftig 33932
+ßen_ 33926
+_heu 33923
+gier 33817
+ellt 33754
+ickl 33744
+erke 33667
+unde 33627
+klun 33599
+cklu 33555
+verh 33519
+tten 33518
+heut 33387
+lini 33310
+nnte 33289
+_fre 33235
+eres 33233
+dami 33155
+amit 33085
+rakt 33074
+fest 33044
+iger 32980
+wisc 32604
+_bez 32312
+einz 32272
+_fes 32114
+währ 32046
+rger 32044
+anis 32030
+hter 32014
+isie 31960
+gang 31915
+zwis 31871
+_zie 31827
+rsta 31676
+_zwi 31661
+mung 31575
+chtu 31529
+litä 31375
+vere 31325
+ding 31322
+eln_ 31277
+nisc 31236
+dert 31140
+sozi 31086
+tlin 31042
+_sag 31033
+rgan 30989
+ßnah 30964
+ste_ 30941
+htun 30885
+maßn 30856
+aßna 30853
+würd 30835
+_gan 30829
+nsam 30800
+same 30710
+_ihn 30654
+spie 30613
+denn 30557
+gibt 30530
+_maß 30516
+gesa 30492
+iell 30464
+selb 30429
+kte_ 30288
+ort_ 30286
+_bür 30146
+ndli 30137
+fass 30113
+hied 30082
+kung 30072
+opa_ 30055
+bürg 30047
+_han 30023
+ürge 29966
+immu 29944
+zial 29893
+_wor 29834
+_soz 29785
+stra 29770
+piel 29666
+hrer 29663
+räge 29587
+ller 29580
+nken 29555
+rete 29548
+rhal 29536
+olge 29513
+ogra 29271
+nsti 29232
+ozia 29207
+ganz 29199
+rrn_ 29190
+errn 29188
+rauc 29161
+chun 29069
+heid 29034
+egt_ 29028
+_ebe 28997
+ale_ 28994
+twor 28994
+dien 28975
+ntwo 28950
+erli 28912
+ußer 28904
+bewe 28901
+mmer 28876
+sage 28872
+ftli 28870
+antw 28865
+all_ 28843
+_gib 28813
+verw 28795
+bede 28748
+eitr 28721
+tspr 28718
+lass 28707
+issa 28650
+leis 28601
+_da_ 28581
+eset 28529
+roll 28492
+mmt_ 28424
+immt 28423
+rdnu 28409
+dnun 28407
+erbr 28377
+_gle 28334
+dann 28331
+ativ 28303
+brau 28229
+klic 28171
+wiss 28151
+res_ 28136
+zust 28035
+weil 28005
+rtra 28003
+afts 28002
+hts_ 28001
+ress 27944
+aftl 27926
+ener 27911
+erbe 27841
+örde 27822
+aren 27812
+rwei 27777
+_bew 27713
+vera 27685
+nges 27684
+_tra 27643
+_vol 27627
+_bin 27602
+prog 27574
+nts_ 27555
+_sel 27543
+wert 27525
+stru 27502
+spre 27486
+wied 27474
+_lei 27448
+sehe 27425
+frei 27392
+lag_ 27384
+zieh 27348
+ften 27333
+lieg 27329
+rauf 27318
+_mic 27274
+_beh 27225
+edoc 27225
+mich 27224
+nomm 27221
+jedo 27205
+oll_ 27185
+rogr 27169
+riff 27143
+gram 27065
+ramm 27062
+nie_ 27043
+dank 27006
+letz 26971
+prec 26955
+find 26846
+geht 26837
+wohl 26742
+anz_ 26717
+roße 26703
+erin 26676
+fina 26676
+mark 26672
+_tei 26642
+emen 26622
+rges 26609
+rend 26564
+such 26559
+fung 26477
+nanz 26413
+bess 26407
+etze 26372
+rneh 26303
+nsic 26287
+_wür 26272
+rin_ 26256
+trie 26239
+enhe 26231
+rfah 26216
+arte 26206
+_eu_ 26113
+voll 26096
+ürde 26028
+tter 25975
+mati 25916
+spro 25864
+enz_ 25767
+mal_ 25708
+aush 25687
+_kri 25628
+_mac 25588
+zier 25579
+okra 25531
+krat 25513
+verl 25435
+herh 25434
+llun 25428
+_mus 25417
+tel_ 25409
+niss 25402
+usha 25388
+_am_ 25366
+arau 25364
+edeu 25352
+ehör 25351
+enst 25344
+teht 25326
+nete 25303
+nger 25301
+_bis 25295
+ssar 25287
+chwe 25257
+_erh 25249
+gewi 25209
+det_ 25117
+sorg 25046
+zahl 25008
+ders 24981
+ihne 24958
+egel 24887
+rege 24870
+_jet 24838
+stre 24828
+auße 24820
+etzu 24795
+jetz 24767
+raus 24715
+biet 24693
+nner 24677
+kont 24672
+huss 24611
+_auß 24579
+erna 24578
+demo 24573
+_erg 24556
+hrt_ 24526
+verk 24517
+leme 24511
Index: src/plugin/languageidentifier/build.xml
===================================================================
--- src/plugin/languageidentifier/build.xml (revision 180032)
+++ src/plugin/languageidentifier/build.xml (working copy)
@@ -9,6 +9,10 @@
+ Copying test files
+
+
+