Admintagebuch - Dokumentation der Admintätigkeiten

Ich habe jetzt die Service-VM etwas weiter konfiguriert (ansible-ffms-Branch ffservice). Die Karte ist schon unter http://89.163.231.228/map/ erreichbar, enthält aber nur legacy und Warendorf, da die gretap-Tunnel noch fehlen. Außerdem fehlt batctl und wäre im Repository nur in Version 2014.3.0-2 verfügbar. Ich dachte, wir hätten mit Debian8 ein aktuelles batman (Kernel ist 3.16.7-ckt11-1+deb8u6)? Muss ich noch was zusätzlich installieren? Oder kann man ein altes batctl weiterverwenden?

2 „Gefällt mir“

Routing der zusätzlichen IPs vom Host greyworm gefixt.

Siehe https://freifunk-muensterland.de/wiki/doku.php?id=intern:infrastruktur:greyworm#besonderheiten_zu_beachten

1 „Gefällt mir“

@Fungur: Batctl musst du immer manuell installieren. Ich habe dazu die Ansible-Rolle im Entwicklungszweig kürzlich angepasst.

Können wir uns darauf einigen, dass hier nur Admin-Tätigkeiten geschrieben werden, und bei der ersten Frage zu einer Sache direkt ein neuer Thread auf gemacht wird? Bitte hier keine Antwort sondern einfach machen :wink: THX

3 „Gefällt mir“

greyworm: VMs waren down, keine Ahnung warum. Bevor ich ergründen konnte warum hat “Trigger-Finger” @mpw den host gebootet. :wink: Was ich aus den Augenwinkel gesehen habe ist das die VMs durchaus nach Boot hochlaufen, es muss sie also irgendein Ereignis runtergeholt.
Merke auf: Beim nächsten mal erst ins Log schauen bevor man reset drückt :smile:

Komischerweise hat der Reboot nicht geklappt, Host hing (reset).
Dabei die VMs von 4Gb auf 1Gb RAM reduziert - mehr als genug.

greyworm unter VMWare neu aufgesetzt. greyworm-1 bereitgestellt, keys drauf. Bon Voyage!

1 „Gefällt mir“

Habe ich wohl vergessen zu erwähnen: greyworm-2 und greyworm-3 sind auch ready mit Schlüsseln daruf. greyworm-4 mache ich gerade noch “auf Halde”, dann sind mir auch die IPs ausgegangen.

3 „Gefällt mir“

greyworm-1 neu gestartet @mpw

1 „Gefällt mir“

Ich habe für greyworm mal einen Service-Account eingerichtet mit dem man die VMs neustarten kann, auf die Konsole schauen kann sowie Snapshots erstellen und wiederherstellen kann.
Der ist bei @mpw und @void (aber nur weil ich von den anderen keinen PGP key zur Hand hatte)

Weiterhin habe ich einen zusätzlichen Admin Acount erstellt da der Default Account durch Script-Kiddies immer wieder gelockt wurde.

Host und VMs haben jetzt DNS Einträge (greyworm-1 … greyworm-4.kgbvax.net)

2 „Gefällt mir“

Ich hab auf Des1 und Des2 per default bgp_local_pref die standard IPv6-Route von Fra nach Ber verlegt, da die Pakete ohnehin von dort reinkommen und es bei Verbindungen über Fra Paketverluste gab.

Grüße
Matthias

2 „Gefällt mir“

Auf Des2 war das IPv4 auch auf Fra gestellt, das hab ich auch noch geändert.

Und Greyworm-01 hat seit heute Nachmittag wieder Anschluss an @FanLin s Gateway. Die Konfiguration des GRE-Tunnels erfolgte erstmals durch Ansible. @Fungur hat dazu die Templatedatei für die Ansible-Rolle tun_ffms_supernodes noch robuster gemacht.

Domäne-01 auf bird6-radv umgestellt, radvd und isc-dhcp6-server abgeschaltet. Letzterer funktionierte ohnehin nicht korrekt mit Ansible.

Ich habe jetzt die Ansible-Konfiguration auch auf die Domäne-02 ausgerollt und die Verbindung zwischen Greyworm-02 und Des1 wiederhergestellt.

2 „Gefällt mir“

Auf greyworm-2 war die v6 Konfig kaputt, korrigiert, networking restartet. Ping6’ed. :smile:

1 „Gefällt mir“

Danke für’s Reparieren, Ingomar!

Domäne-03 ist soweit fertig: Domäne-03 Steinfurt-West kann getestet werden

@as1 hat heute Zugriff auf die beiden VMs der Steinfurt-West/Domäne-03 bekommen.

Auf den neuen Domänen-SNs ist nach einem “systemctl restart networking” das Interface mesh-vpn nicht mehr im Batman gewesen. Deshalb habe ich folgende Zeile zum bat0-Interface hinzugefügt:

post-up batctl if add mesh-vpn ||:

( ||: sorgt dafür, dass ifup nicht fehlschlägt, wenn mesh-vpn nicht verfügbar ist.)
Per Ansible ausgerollt.

1 „Gefällt mir“

collectd rollen auf den Maschinen von domaene-01, domaene-02, domaene-03 und testdomaene ausgerollt

1 „Gefällt mir“

Remü heute morgen wieder abgestürzt. Da kommt jetzt VMware drauf und fertig.

Remü-02 ist abgeschaltet, IPv6 in Domäne-03 iwie kaputt deswegen, obwohl die Pakete eigentlich umgeleitet werden müssten. Das hab ich noch nicht im Detail analysiert. Mein eigenes IPv6 scheint kaputt zu sein.

Ich habe gerade, auf allen FanLin-Maschinen, ein [bind9-Sicherheitsupdate][1] eingespielt.
@Parad0x @descilla @kgbvax @Fungur @MPW @void
Bitte alle anderen Maschinen ebenfalls überprüfen (apt-get update / upgrade)
[1]: https://www.debian.org/security/2015/dsa-3420

  • Ein paar fastd Connections hin und her geschubst. Ich hatte auf sn-descilla-1 schon wieder ~ 200 Connections. Da aber eine weitere Maschine auf dem Blech als Backbone-Server läuft und ich in den ersten 16 Tagen des Monats schon knapp 9 TB Traffic (outgoing) auf meinem Blech hatte, muss ich etwas Traffic sparen.
  • Cherry picking von master nach entwicklungszweig im ansible-ffms repo bzgl. der collectd Rolle.
  • Collectd Rolle aktualisiert
  • über das Setzen einer Variable kann nun das Erfassen von Daten für DHCP und fastd deaktiviert werden
  • README.md mit Erklärung der Variablen für die Collectd Rolle erstellt. Die dynamisch erzeugten “managed by ansible” kommentare durch statische ersetzt in den template-files der collectd rolle.
  • group_vars entsprechend angepasst.
  • Jeden Unterpunkt in einem eigenen Commit erfasst, um cherry-picking zu vereinfachen.
  • Angepasste collectd-Rolle (ohne fastd und DHCP) auf die Backbone-Server des1 sowie fanlin ausgerollt. Diese landen in graphite jetzt unter dem Target backbone.*.