Il a été un des principaux développeurs de la bibliothèque d'indexation Lucene[2], commencé en 1997 et mise sur le site SourceForge.net en mars 2000, et du moteur de recherche Nutch, et a été nommé architecte en chef de Cloudera[3],[4].
Il est le cofondateur de Hadoop[5], une des principales solutions dans le domaine du Big data. L'idée du nom et du logo d'Hadoop, un éléphant jaune, vient d'une peluche de son fils alors âgé de 5 ans[5]. Il cherchait un nom court, facile à retenir et à prononcer, et jamais utilisé auparavant[6].
Il a été récompensé en 2015 par O'Reilly pour l'ensemble de ses travaux[7].