Index: tika-core/src/main/resources/org/apache/tika/mime/tika-mimetypes.xml
===================================================================
--- tika-core/src/main/resources/org/apache/tika/mime/tika-mimetypes.xml (revision 1445425)
+++ tika-core/src/main/resources/org/apache/tika/mime/tika-mimetypes.xml (working copy)
@@ -171,6 +171,9 @@
+ AI
+ <_comment>Adobe Illustrator Artwork
+ http://en.wikipedia.org/wiki/Adobe_Illustrator_Artwork
]
@@ -186,6 +189,9 @@
+ <_comment>Java Archive
+ http://en.wikipedia.org/wiki/.jar
+ com.sun.java-archive
@@ -296,6 +302,8 @@
<_comment>Microsoft Word Document
+ http://en.wikipedia.org/wiki/.doc
+ com.microsoft.word.doc
@@ -383,6 +391,9 @@
PDF
<_comment>Portable Document Format
+ http://en.wikipedia.org/wiki/PDF
+ http://www.adobe.com/devnet/pdf/pdf_reference_archive.html
+ com.adobe.pdf
@@ -3291,6 +3302,10 @@
+ XML
+ <_comment>Extensible Markup Language
+ http://en.wikipedia.org/wiki/Xml
+ public.xml
@@ -3346,6 +3361,8 @@
<_comment>Compressed Archive File
+ http://en.wikipedia.org/wiki/ZIP_(file_format)
+ com.pkware.zip-archive
@@ -3801,6 +3818,8 @@
GIF
<_comment>Graphics Interchange Format
+ http://en.wikipedia.org/wiki/Gif
+ com.compuserve.gif
@@ -3827,6 +3846,8 @@
JPEG
<_comment>Joint Photographic Experts Group
+ http://en.wikipedia.org/wiki/Jpeg
+ public.jpeg
@@ -3947,6 +3968,7 @@
DWG
<_comment>AutoCad Drawing
+ http://en.wikipedia.org/wiki/.dwg
@@ -3954,6 +3976,8 @@
+
+
@@ -3970,6 +3994,9 @@
+ DXF
+ <_comment>AutoCAD DXF
+ http://en.wikipedia.org/wiki/AutoCAD_DXF
@@ -3988,7 +4015,11 @@
-
+
+ ICO
+ http://en.wikipedia.org/wiki/.ico
+ com.microsoft.ico
+
@@ -4430,6 +4461,9 @@
+ <_comment>HyperText Markup Language
+ HTML
+ public.html