Also irgendwie reden wir etwas aneinander vorbei fürchte ich fast...
Also gehen wir mal die Punkte der Reihe nach an:
a) Dein SSH Problem auf Windows Seite:
Hier wäre meine Vermutung, dass Du die known_hosts Datei mit kopiert hast und daher localhost nun einen anderen private key hat als erwartet. Die Meldung von ssh solle aber so aussagekräftig sein, dass dies schnell zu beheben sein dürfte.
(Sprich: den falschen Eintrag in der known_hosts entfernen)
Es kann natürlich auch andere Gründe geben, z.B. die erneute Erzeugung von private Keys für den Server nach einem bereits erfolgten connect.
b) Mögliche Installationen unter Windows:
Man kann Hadoop direkt unter Windows installieren (ggf. mit zusätzlichen Binaries, da die *.so Dateien so erst einmal nicht unter Windows funktionieren - z.B.
https://github.com/cdarlint/winutils).
Man kann aber auch das Windows Subsystem für Linux (WSL) nutzen. Dann hat man eine Installation unter Linux (Ubuntu nutzt Microsoft für das WSL wenn ich das richtig verstanden habe).
c) Zusammenarbeit bei Installationen
Generell implementiert Hadoop hier ja eigene Protokolle, sprich die Services kommunizieren miteinander. Dies ist unabhängig vom Betriebssystem, daher sollte eine Windows Installation mit Linux Installationen zusammen arbeiten ohne dass es zu großen Problemen kommt. Ich muss aber gestehen, dass ich dies noch nicht wirklich gemacht habe. Werde ich einmal bei Gelegenheit ausprobieren, in dem ich einen Windows slave bei mir hinzu füge.
d) Abhängigkeit zu SSH
Nach meinem Verständnis ist die Abhängigkeit zu SSH nur doch nur in erster Line für das Management des Clusters. Für die eigentliche Nutzung ist es später nicht notwendig, denn die Client connecten sich zu dem Master und der verteilt dann doch meines Wissens nach die Aufgaben und so. Aber ich muss gestehen, dass ich mich hier nur sehr oberflächig eingelesen habe.
Aber die Installation des Windows Nodes, den ich gerade plane, werde ich ohne irgend eine SSH Installation durchführen.
Und natürlich erfolgt dann die Verwaltung über Windows Boardmittel. Ein einfaches Powershell-Script könnte da schon ausreichen (Wobei es da im Enterprise Bereich deutlich bessere Lösungen gibt meine ich. Aber das ist jetzt erst einmal egal).
Mit den Punkten im Hinterkopf wird evtl. deutlich, wieso ich etwas differenziert habe zwischen dem reinen hadoop und den Hilfsscripten, die auf SSH aufsetzen (und die nicht zwingend notwendig sind aus meiner Sicht).