En 1993 Mark Pesce et Tony Parisi développèrent une interface 3D pour le web, laquelle incorporait une grande partie des recherches sur la réalité virtuelle et sur les réseaux (les liens hypertextes par exemple). Ils communiquèrent ces innovations à Tim Berners-Lee, l'inventeur du langage HTML, et Pesce fut invité à présenter une communication à la première conférence internationale sur le World Wide Web à Genève. Lors d'une réunion à propos des interfaces de réalité virtuelle les participants se mirent d'accord sur la nécessité de définir un langage commun permettant de décrire des scènes 3D et des hyperliens, tout comme le HTML, mais pour des applications de réalité virtuelle. Le terme Virtual Reality Modeling Language (VRML) fut adopté, et le groupe (présidé par Pesce et Brian Behlendorf, du magazine WIRED) commença à travailler sur la spécification du langage VRML immédiatement à la suite de cette conférence.
Avec l'aide du magazine WIRED, Behlendorf mit en place un système de mailing list pour faciliter les discussions sur la spécification de VRML. Le résultat dépassa leurs espérances, en une semaine ils obtinrent plus d'un millier de participants. Rapidement ils adoptèrent un ensemble de contraintes pour VRML, et se mirent en quête de technologies pouvant être adaptées pour les satisfaire.
Les membres proposèrent plusieurs candidats au titre du langage VRML, et après pas mal de délibérations, un consensus s'établit autour du langage Open Inventor de Silicon Graphics Inc(SGI). Le Format des fichiers textes Inventor permet la descriptions de scènes 3D complètes avec rendu des objets sous forme de polygones, de traiter l'éclairage, les textures et d'autres effets réalistes. Il possédait toutes les qualités attendues par les professionnels, une large diffusion, et de nombreux outils pour le développement.
Un sous-ensemble du format de fichier Inventor, possédant des extensions pour le réseau, est à la base de VRML. Gavin Bell de Silicon Graphics a adapté le format Inventor pour VRML. SGI a mis ce format dans le domaine publique et fournit un parser toujours dans le domaine publique pour faciliter le développement d'outils et de visualisateurs VRML.
VRML est conçut de manière à satisfaire 3 critères: