Natürliche Sprache ist nichts anderes als menschliche Sprache, sowohl in gesprochener als auch in schriftlicher Form. Voll ausgebildete Gebärdensprachen zählen ebenfalls dazu. Für uns ist aber nur die Schriftform relevant. Natürlich lassen sich Worte auch einsprechen und Gebärden aufzeichnen, aber es liefe auf das Gleiche hinaus, denn für die maschinelle Sprachverarbeitung müssen die Informationen stets in binär kodierte Schriftzeichen übersetzt werden.
In der Praxis können bei der visuellen Suche einfach Worte, Wortkombinationen, Sätze oder Halbsätze zum Finden von Bildern verwendet werden. Dabei sind über den alltäglichen Sprachgebrauch hinaus keine besonderen Regeln zu beachten. Man ist folglich äußerst flexibel beim Formulieren einer Suchanfrage. Diese darf auch sehr spezifisch sein und könnte z.B. so aussehen:
Foto von einem älteren Mann mit Sonnenhut, der in einem Ruderboot sitzt und angelt
Werden damit keine Treffer erzielt, sollten weniger wichtige Suchkriterien schrittweise entfernt werden. Beispiel:
Ein älterer Mann sitzt in einem Boot und angelt
Usw., wobei die Regeln für Groß- und Kleinschreibung nicht relevant sind. Gleiches gilt für die Stellung von Satzgliedern (solange die Bedeutung des Satzes erhalten bleibt). Die Sätze Ein Mann angelt am See und Am See angelt ein Mann sollten daher zum selben Suchergebnis führen.
Die visuelle Suche funktioniert übrigens auch mit weniger verbreiteten Sprachen (jedoch nicht immer mit gleicher Präzision). Eine Implementierung ist bereits für über hundert Sprachen möglich – von Afrikaans bis Zulu.