Иногда полезно получить текст из часто используемых форматов, таких как PDF или DOC. Делается это, например, для построения индекса и дальнейшего поиска документов.
В серии заметок на хабре «Текст любой ценой», Алексей Рембиш делится PHP-классами для получения текста из: