아파치 티카란?
아파치 티카는 PPT, CSV, PDF등 다양한 형태의, 파일의 메타 데이터와 텍스트를 감지하고 추출하는 라이브러리 입니다.
지원되는 포멧은 아래와 같습니다.

- tika-core : 핵심 라이브러리(파서 없음)
- tika-parsers - core + Tika Parser interface(두가지)
- 위 두가지 라이브러리를 사용하여 파일을 읽을 수 있습니다.
<dependency> <groupId>org.apache.tika</groupId> <artifactId>tika-core</artifactId> <version>2.0.0-ALPHA</version> </dependency> <dependency> <groupId>org.apache.tika</groupId> <artifactId>tika-parsers</artifactId> <version>2.0.0-ALPHA</version> <type>pom</type> </dependency>
- 위의 라이브러리를 추가 후에
