lectura de documentos de Word binarios implicaría la creación de un programa de análisis de acuerdo con las especificaciones de formato de archivo para el Formato DOC. Creo que esta no es una solución viable real.
Puede usar el Microsoft Office XML formats para leer y escribir archivos de Word; esto es compatible con las versiones 2003 y 2007 de Word. Para leer, debe asegurarse de que los documentos de Word estén guardados en el formato correcto (se denomina documento XML de Word 2003 en Word 2007). Para escribir, solo tiene que seguir el esquema XML disponible de forma abierta. Nunca he usado este formato para escribir documentos de Office desde PHP, pero lo estoy usando para leer en una hoja de cálculo de Excel (naturalmente guardada como XML-Spreadsheet 2003) y mostrar sus datos en una página web. Como los archivos son simplemente datos XML, no hay problema para navegar dentro y descubrir cómo extraer los datos que necesita.
La otra opción, una opción solo de Word 2007 (si los formatos de archivo OpenXML no están instalados en Word 2003), sería rescatar a OpenXML. Como databyss señaló here el formato de archivo DOCX es solo un archivo ZIP con archivos XML incluidos. Hay muchos recursos en MSDN con respecto al formato de archivo OpenXML, por lo que debería poder descifrar cómo leer los datos que desea. Escribir será mucho más complicado, creo, solo depende de cuánto tiempo va a invertir.
Quizás pueda echar un vistazo a PHPExcel que es una biblioteca capaz de escribir en archivos de Excel 2007 y leer desde archivos de Excel 2007 utilizando el estándar OpenXML. Puede hacerse una idea del trabajo que implica tratar de leer y escribir documentos de OpenXML Word.
Me parece MUCHO improbable que pueda lograr esto sin utilizar COM. –