Werkzeuge für BDCC/AI
Meine Awesome-Seiten befinden sich in Transition nach GitHub:
- Digitaler Ressourcen-Pool
- Werkzeuge » Abschlussarbeiten
- Werkzeuge » Software-Engineering
- Werkzeuge » BDCC/AI
Diese Seite repräsentiert Awesome Big Data und Cloud Computing für KI.
- Die Werkzeuge sind im Zweifelsfall für Studierende und private Nutzung, weniger für Unternehmen oder Freelancer (wegen der Lizenzbedingungen/EULA)
- Die kostenlosen Werkzeuge sind nicht immer Best-in-Class im Vergleich zu kostenpflichtigen/„(€)” Alternativen, dennoch bleiben kostenpflichtige Angebote hier meist Out-of-Scope
- Ein Windows-zentrischer Ersteindruck durch die Chocolatey-Referenzen kann leicht täuschen, denn die kostenlosen oder quelloffenen Tools gibt es i.d.R. auch für Linux oder MacOS mittels snap/flatpak/brew/etc.
- Empfehlung zu Chocolatey: choco feature enable -n useRememberedArgumentsForUpgrades
Data Science
- Tableau: Datenexploration und Visualisierung [choco install tableau-desktop]
- Tableau ist kostenlos für Studierende
- Exploratory Desktop: Datenexploration und Visualisierung
- Exploratory ist kostenlos für Studierende
- Metabase Open Source Edition: Datenexploration und Visualisierung [docker run -d -p 3000:3000 --name metabase metabase/metabase]
- Rucio [via Docker]: Scientific Data Management
- KNIME [choco install knime]
- RapidMiner for Academics mit Educational License Program [choco install rapidminer]
- (im Kern ist RapidMiner Studio auch Open Source)
- KNOWAGE Community Edition (formerly: SpagoBI)
- Eclipse BIRT [choco install eclipse zzgl. BIRT-Installation]
- Juyter Docker Stacks [docker run -p 8888:8888 jupyter/scipy-notebook]
- binder: das Cloud-Bindeglied zwischen Jupyter und Ihren git-gehosteten Notebook-Dateien (Obacht: Wenn in den USA die Leute aufstehen, dann geht der globally-shared Infrastruktur von binder ggf. die Puste aus, daher ggf. nicht ausreichend zuverlässig für Lehrveranstaltungen oder Konferenz-Demos)
- CoCalc: Collaborative Computation and Data Science
- Unterstützt auch SageMath Worksheets, SageMath ist eine Open Source Alternative zu Matlab und Mathematica
- SQL Notebook [choco install sqlnotebook]
- Alternative: Tad [choco install tad]
- Google Collab
- HoloViz: Bibliotheken zur Datenvisualisierung in Python; u.a. graphisches Dashboarding-Werkzeug Panel
- Datensets
- Sammlungen: kaggle Datasets ⭐ | Open Data on AWS | Awesome Public Datasets ⭐
- Kuratiert: 100 interesting data sets for statistics | Springboard: free public data sets for your data science project
- Semantic Web: DBpedia
- Ökonomie: Worldbank Open Data
- Zeichnungen: Quick Draw! The Data (Montagsmaler-ähnlich; bspw. Ameisen)
- COVID: CORD-19, EDC Datensets
- Programmierung: The Stack | für SQL: vgl. NSQL-Listing
- Weiterführende Quellen: Awesome Data Science | Awesome Data Science Software in Python
- DbVisualizer [choco install db-visualizer]: Advanced SQL Editor
- Alternativen: DBeaver Community Edition [choco install dbeaver] mit Open-Source Hintergrund, Open Source Beekeeper [choco install beekeeper-studio.portable]
- (€:) DataGrip, kostenlos über die Free Educational Licenses für Studierende
- DbGate [choco install dbgate.portable]: Open-Source Cross-Plattfrom SQL Editor, inkl. NoSQL-Unterstützung und starkem JSON-Viewer
- DbSchema Community Edition: SQL Editor, Schema Reverse Engineering and Visualization
- (Pro Version: Schema Management and Database Change Management)
- SchemaCrawler [choco install schemacrawler]: Open-Source Database Schema Discovery and Comprehension Tool; generates Schema Diagrams
- SchemaSpy: Schema Reverse Engineering and Visualization for Schema Documentation
- Flyway Community Edition: Database Change Management
- Navicat Data Modeler, kostenlos als Navicat Data Modeler Essentials 3;
- Navicat unterscheidet sehr schön konzeptionelle, logische und physische Modellierung
- Leider ist auch bei Navicat für die konzeptionelle Modellierung die Entity/Relationship-Umsetzung unbrauchbar
- Data Engineering / Data Integration
- «Open Source / Desktop» Talend Open Studio
- «Open Source / Web» Airbyte
- «Geheimtipp(€€€)» Ab Initio (obwohl es nicht im Gartner Magic Quadrant for Data Integration Tools auftaucht)
- Open-Source-Alternativen: vgl. Artikel von Atlan (Kandidaten: Singer, dbt, PipelineWise, Meltano, Pentaho)
- Data Quality
- «Open Source» Talend Open Studio for Data Quality | Soda Core
- «Empfehlung(€€€)» Collibra (im Visionary-Quadrant des Gartner Magic Quadrant for Data Quality Solutions 2022)
- Data Governance / Metadata Management (früher: Data Catalog)
- «Open Source» vgl. Artikel von Atlan (Kandidaten: Apache Atlas, Amundsen Lyft, LinkedIn DataHub, Netflix Metacat, OpenMetadata)
- «Empfehlung(€€€)» Collibra (im Leader-Quadrant des Gartner Magic Quadrant for Metadata Management Solutions 2018)
- Forschungsdatenmanagement? vgl. Schwesterseite Dozenten-Werkzeuge
- Data Lineage
- Gudusoft SQLFlow: SQL Visualisierung ein oder mehrerer SQL Befehle, kostenlos, in der Cloud
- «Open Source» vgl. Artikel von Atlan (Kandidaten: Tokern, Egeria, Pachyderm, OpenLineage, TrueDat)
- Nennenswert: Wird auch von Collibra abgedeckt (Data Lineage fällt aus Sicht von Gartner in den Magic Quadrant for Data Quality Solutions, Collibra ist ggf. hier nicht Best-in-Class aber wegen Collibras Überlappung mit DQ und MDM attraktiv)
- CleverCSV: Generiere Python-Code für CSV-Imports, zzgl. Bibliotheksfunktionen für Data Cleaning
- WinPure Clean & Match: Data Cleaning / Data Quality; kostenlose Community Lizenz
- Alternativen: Open-Source OpenRefine [choco install openrefine] ehem. Google |
Alteryx Trifacta: Ebenfalls Data Cleaning / Data Quality; mit universitärem Hintergrund aber heute kommerziell; es gibt allerdings eine Educational License
- Alternativen: Open-Source OpenRefine [choco install openrefine] ehem. Google |
- DataVault Builder als Educational Edition
- RelaX: calculates any relational algebra statement like ( σ a > 42 ( A ) ) ⋈ ( π a,b ( B ) ) on a set of relations
- Functional Dependencies:
- Weiterführende Quellen: Awesome Database Tools | Awesome Open-Source Data Engineering (ähnliche Liste mit kommerziellen Optionen)
- EXASOL: In-Memory-basiertes MPP-fähiges ACID-konformes RDBMS für analytische Workloads
- Dialekt: Standardkonformes ISO SQL + hochgradig Oracle-kompatibel
- Als Community Edition kostenlos als VM Image für bis zu 200 GB Rohdaten, mit Default Port 8563
- Als Docker Container, allerdings derzeit nur unter Linux
- Exasol ist der langjährige Testsieger im TPC-H Benchmark für DWH-Systeme (suite of business oriented ad-hoc decision support queries and concurrent data modifications)
- DuckDB: “SQLite for analytics” / In-Memory-basiertes In-Process-fähiges ACID-konformes RDBMS für analytische Workloads
- Dialekt: PostgreSQL
- Technisch nicht auf Augenhöhe mit einer Single-Node EXASOL Community Edition
- Sweet Spot: Embeddable in analytische Anwendungen („runs anywhere”), insb. für Python und Pandas
- Volltextsuche
- Elastic bzw. ELK-Stack [via Docker oder choco install elasticsearch sowie choco install kibana]: im Kern eine verteilte Volltext-Suchmaschine, basierend auf Lucene; aber auch als skalierbares NoSQL-System verwendbar
- typesense: Typo-tolerante Suchmaschine, optimiert für niedrige Latenzzeiten und hohe Suchleistung
- Klassische Open-Source RDBMS:
- MySQL [choco install mysql sowie choco install mysql.workbench], mit Default Port 3306
- MariaDB [docker run -d -p 3306:3306 -e MYSQL_ROOT_PASSWORD=geheim mariadb:latest] sowie Maria Galera = Multi-Master-Cluster
- PostgreSQL [choco install postgresql --params '"/Password:geheim /Port:5432"' --params-global]
- SQLite [choco install sqlite sowie choco install sqlite.shell und ggf. choco install sqlite-studio.portable]
- Klassische kommerzielle RDBMS:
- Oracle eXpress Edition [docker run -d -p 1521:1521 -e ORACLE_PASSWORD=geheim gvenzl/oracle-xe]
- Microsoft SQL Server Express [choco install sql-server-express sowie choco install sql-server-management-studio] ggf. noch statischen Port 1433 konfigurieren
- IBM Db2 Community Edition [via Docker]
- Datenbanksysteme für PWAs: CouchDB (online) + PouchDB (offline+sync)
- BaseX: XML DBMS und XQuery Engine
- Graph-Datenbanksysteme
- Neo4j [choco install neo4j-community]: Cypher Anfragesprache (Further Reading: Neo4j GraphAcademy)
- ArangoDB [via Docker]: AQL Anfragesprache (Further Reading: ArangoDB University)
- RDF Databases / SPARQL-fähige Triple Stores? siehe unten im Abschnitt „Moderne Web-Anwendungsentwicklung” zu Semantic Web / Linked Open Data
- DBaaS:
- bit.io: kostenloses 10GB Postgres Datenbanksystem in der Cloud (Datensätze für Postgres bspw. von morenoh149)
- OCI Cloud Free Tier: bis zu zwei kostenlose Oracle DB-Instanzen, je 20GB, verschieden Typen, bspw. Exadata oder NoSQL
- dbfiddle: Browser-basierter SQL-Datenbank-Playground (diverse Datenbanksysteme)
- MongoDB Atlas: Cloud-Variante des klassischen NoSQL-Systems (The „M” in MEAN and MERN) – kostenlos für 512MB
- CockroachDB SQL-Playground: Cloud-Variante des NewSQL-Datenbanksystems (s. unten)
- RDBMS Research Prototypes:
- LeanStore: high-performance OLTP storage engine optimized for many-core CPUs and NVMe SSDs (Prof. Viktor Leis)
- HyPer: main-memory-based relational DBMS for mixed OLTP and OLAP workloads (aquired by Tableau)
- Umbra: a disk-based system with in-memory performance
- Peloton: self-driving main-memory-based relational DBMS for mixed OLTP and OLAP workloads
Big Data
- Archetype Petabyte-scale Frameworks (insb. analytische Workloads): Apache Hadoop (Two-Phase MapReduce, batch mode, „active Archive”), inkl. dessen Erweiterung durch Apache Spark (RDD, iterative algorithms, In-Memory)
- NoSQL: DB-Engines Rankings Key/Value-Stores | Document-Stores | Wide-Column-Stores
- Scalable OLAP: EXASOL (→ s.oben!): Closed-Source MPP-fähiges und In-Memory-basiertes ACID-konformes RDBMS (MPP-DBMS; OLAP workloads); für analytische Anwendungen wie BI/DWH, DSS und Data Science; sehr hohe SQL-Standard-Kompatibilität und hohe Oracle-SQL-Dialekt-Kompatibilität
- Alternative: (€) Snowflake als Cloud-native DWaaS
- Scalable OLTP: CockroachDB [via Docker]: Open-Source NewSQL; PostgreSQL-compatible; built on a transactional and strongly-consistent key-value store
- Alternative: YugabyteDB [via Docker]: Open-source NewSQL; PostgreSQL-compatible
- Scalable HTAP: PingCAP TiDB: [via Quick Start Guide]: Open-source NewSQL (OLTP/HTAP workloads); MySQL-compatible; built on a transactional key-value store
- λ/Lambda-Architektur (Nathan Marz) „separate batch vs. speed layer”: klassisch bspw. basierend auf Apache Hadoop + Apache Storm
- vgl. auch Twitter Summingbird
- ϰ/Kappa-Architektur (Jay Kreps) „unified batch-&speed-layer”: bspw. basierend auf Apache Flink
- (Flink hat seinen Urspruch in Stratosphere, einem Projekt dreier deutscher Hochschulen, u.a. von Prof. Dr. Volker Markl)
- Kappa-Architekturen können auch basieren auf Kafka Streams, Spark Streaming, Kinesis Data Streams, etc. pp.
- Apache Druid: Time Series Database; real-time (i.e., sub-second) analytics database, with separation of ingest compute and query compute
- Alternative: InfluxDB Open Source: Time Series Database; developed for operations monitoring and focuses on real-time (i.e., sub-second) analytics of IoT Data; core component of the TICK stack
- Splunk Free (500MB pro Tag)
- Cloud: Matano, eine „open source security lake platform for AWS”
- Log-Analysen:
- GPU-Computing:
- OpenCL (Open Computing Language): Standardschnittstelle für paralleles Rechnen mit aufgaben- und/oder datenbasierter Parallelität, als HW-Plattform-Abstraktion für CPUs, GPUs, DSPs, FGPAs, usw.
- Java: JOCL = Java bindings for OpenCL | Lightweight Java Game Library (LWJGL) = Java-Abstraktion für OpenGL, OpenAL, OpenCL und OpenVR
- OpenCL (Open Computing Language): Standardschnittstelle für paralleles Rechnen mit aufgaben- und/oder datenbasierter Parallelität, als HW-Plattform-Abstraktion für CPUs, GPUs, DSPs, FGPAs, usw.
- Weiterführende Quellen: Awesome Big Data | Hadoop Ecosystem Table
Moderne Web-Anwendungsentwicklung
- BuildWith: Find out what websites are built with
- Watch-Lists (Projects): OpenJS, CNCF, State of JS, DB-Engines, ThoughtWorks Technology Radar
- Starter-Kits/Blueprints (Frontend/Backend/Full-Stack):
- Java-zentrisch: JHipster (TechStack-Docu) | Spring Initializr
- Any Lang: CodebaseShow » RealWorld ⭐ [github-Repo] | JHipster Non-Java-Blueprints
- JS-zentrisch: Meteor.js, refine, SaaS Starterkit (Next.js)
- Svelte (Client-side) sowie SvelteKit (Server-side): Newcommer Web-Framework und Alternative zu Angular/React/Vue
- TS Play: Online TypeScript Editor/Playground
- Die üblichen Verdächtigen (Client-side):
- Micro Frontends: Webartikel 11 Micro Frontends Frameworks You Should Know
- Die üblichen Verdächtigen (Server-side):
- Java: Micronaut [CLI: choco install micronaut] | Spring Boot [choco install spring-boot-cli] insbesondere mit Spring WebFlux + Netty
- C#: ASP.NET Core [choco install dotnet-aspnetruntime]
- JS/TS: SvelteKit sowie Next.js | Nuxt | Marko/Fluurt sowie Node.js [choco install nodejs] + Express
- Py: FastAPI | Flask
- Ruby: RoR
- PHP: Laravel
- Spezial-Kontext SAP:
- SAP OpenUI5 (Basis für SAPUI5)
- Free Tier: SAP Business Technology Platform (BTP) für „Individuals”
- SAP Fiori (basiert auf SAPUI5)
- AppGyver / SAP Build Apps (Low-Code-Plattform; technisch losgelöst von OpenUI5/SAPUI5)
- Spezial-Kontext WebAssembly:
- wasmtime: fast and secure runtime for WebAssembly
- Markdown Tools: vgl. Awesome Markdown
- Tools for Web Programmer:
- Generatoren: .htaccess Generator, JQueryForm Form Builder, Flexy Boxes
- HTML Cleaner (auch für CSS und JS) sowie HTML Beautifier DirtyMarkup
- URLs: URL-Decoder
- List of (free) Public APIs
- Markdown Editoren: Obsidian [choco install obsidian] (Verzeichnis als Vault öffnen…)
- Hilfreich: ObisdianShell (Associate Markdown files with Obsidian)
- Nennenswerte Plugins: MK's Guide Empfehlungsliste, obsidian-advanced-uri, obsidian-languagetool-plugin
- Historischer Hinweis: Typora nicht mehr kostenlos nach 0.11.18
- Tools for Web Designers:
- Kostenlose Icons/Stock-Fotos/Illustrationen: vgl. Abschnitt Bildmaterialien auf meiner Schwesterseite
- Tools-Listen von speckyboy: Tools for Web Designers #1, Tools for Web Designers #2, CSS-Tools
- Usage-Statistiken: W³Techs (bspw. PHP-Versions, Wordpress-Versions, uvm.)
- Lorem-Ipsum-Generatoren
- Deutsch:
- neuroflash: KI-gestützte Textgenerierung, kann Deutsch, stilistisch das was man „SEO-optimiert” nennt (kostenlose 2000 Wörter)
- Englisch:
- AI writing assistants: OpenAI ChatGPT („Write a UX brief”, „Write a tagline for my tech gadget landing page”, „Write a user flow for a login page, mobile-first”, „Give me some ideas for a ...” und weitere: ChatGPT-Cheatsheet) aber auch ältere Werkzeuge wie bspw. rytr.me (kostenlose 10K Zeichen), copy.ai (kostenlose 2000 Wörter) oder simplified (kostenlose 3000 Wörter)
- Werkzeugsammlung FutureTools
- Weiterführende Quellen: Awesome Generative AI
- User Experience (UX):
- WebGazer.js: eye tracking library that uses common webcams to infer the eye-gaze locations of web visitors on a page in real time
- Video Conferencing:
- Weiterführende Quellen: Awesome Real Time Communications
- Hosting:
- bspw. Heroku („Free and Hobby”), Google Firebase Hosting („Spark Plan”) oder Amazon AWS („Free Tier”)
- Kostenpflichtig (€): bspw. Hetzner im bayerischen Gunzenhausen
- (Kostenlose Angebote auch bei den Cloud-Marktführern für jamstack (s. oben): Vercel, Netlify, u.a.)
- SEO:
- Google Search Console (GSC) | Google Trends
- The Hoth Google Rank Checker
- RankWatch Website Analyzer + RankWatch Backlink Checker
- Weiterführende Quellen: Awesome Search Engine Optimization | ahrefs Free SEO Tools | buffer Free SEO Tools
- KrakenD: Open Source API Gateway (with KrakenD Designer)
- Quarkus [CLI: choco install quarkus] Kubernetes-native Java Stack
- Weiterführende Quellen: Awesome Webdesign | Frontend Development | Awesome Microservices | Awesome CRDT
Mobile Apps
- Android/Kotlin: Android Studio [choco install androidstudio]
- iOS/Swift: JetBrains AppCode, kostenlos über JetBrains Free Educational Licenses
- Cross-Plattform
- JS/TS: Ionic | React Native
- Dart: Flutter
- App Performance Monitoring (und mehr): Instabug
- Konvertiere eine Webseite in eine mobile App: bspw. GoNative
- In-App Purchases / Monetarisierung: Adapty als Low-Code Plattform und SDK um In-App Subscriptions einfach in Mobile Apps zu integrieren
Semantic Web / Wissensrepräsentation
- Protégé Desktop: open source Ontology Editor (inkl. Getting Started)
- Cloud-Variante: WebProtégé
- Schema.org | YAGO Graph | SparQL on YAGO | SparQL on Wikidata | SparQL on DBpedia | prefix.cc
- OpenLink VirtuosoOpen-Source Edition (VOS) [via Docker]: SPARQL- und SQL-fähiges Multi-Modell-Datenbanksystem / RDF Database
- Apache Jena: open source Java SPARQL-fähiger Triple Store / RDF Database
- Ontotext GraphDB: SPARQL-fähiger Triple Store / RDF Database [with OWL reasoning, forward-chaining]
- Weiterführende Quellen: Awesome Semantic Web, Awesome Knowledge Graph, Awesome Linked Data
Verteilte Systeme
- parallel-ssh [pip install parallel-ssh]: asynchronous parallel SSH client library
- RabbitMQ [choco install rabbitmq]: open-source message broker, Push-based approach (based on Erlang)
- Apache Kafka: open-source pub/sub event streaming, Pull-based approach (open-sourced by LinkedIn in 2011, based on Java/Scala)
- Akka: Actor Model on the JVM (Java/Scala)
- Akka.NET: Akka-based Actor Model for C# and F# (see also petabridge.cmd [choco install petabridge-cmd])
- ZeroMQ: open-source universal messaging library
- NetMQ: .NET Standard port / Native C#
- Datomic: Datalog-Implementierung von Rich Hickey, dabei architekturell interessant weil Distributed, Transactional und Immutable
- Conflict-free Replicated Data Types (CRDT): z.B. SyncedStore | Fluid Framework
- Weiterführende Quellen: Awesome Distributed System Projects | Awesome CRDT
- (Insbesondere dieser Abschnitt überlappt sich mit anderen Abschnitten, daher ist er rein additiv zu verstehen.)
Cloud Computing
- Cloud Marktfüher: Amazon AWS, Microsoft Azure, Google Cloud, Alibaba Cloud, IBM Cloud, Tencent Cloud, Oracle OCI, Heroku (no free tier anymore *sigh*), DigitalOcean, SAP BTP
- jamstack: Vercel (ehem. ZEIT), Netlify, GitHub Pages, Stormkit, Google Firebase, AWS Amplify, Azure Static Web Apps [Awesome JAMstack]
- Empfohlene Docker-Alternative: podman (u.a. daemonless; optional: rootless; v.a. Linux aber auch erste Windows-Gehversuche) sowie ggf. buildah direkt
- Weitere Alternativen: OpenStack KataContainers, AWS Firecracker, google gVisor (und historisch: CoreOS rkt, später per CNCF archived)
- OpenShift Stack ab v4: CRI-O, podman, buildah
- Docker-Werkzeuge:
- Play with Docker: kostenlose Browser-basierte Docker-Umgebung
- hadolint: linter für Dockerfiles [docker run --rm -i hadolint/hadolint < Dockerfile]
- (Es gibt noch eine Lücke: Gibt es einen guten .dockerignore-Generator!?)
- Divio | Northflank | mogenius: kostenlose Deployments für Docker-basierte Proof-of-Concept WebApps
- Letzte Version bspw. von Alpine? Bspw. mittels endoflife.date (EOL)
- Container Registry:
- DockerHub ➔ docker.io/username/appname:tagname
- Git Hub GHCR ➔ ghcr.io/username/appname:tagname
- Red Hat Quay ➔ quay.io/username/appname:tagname
- Eigene Registry-Installation [docker run … docker.io/registry:2] ➔ localhost:5000/username/appname:tagname
- (zzgl. diejenigen von Amazon, Microsoft, ...)
- Kubernetes:
- Browser
- Play with K8s: kostenlose Browser-basierte Kubernetes-Umgebung
- OpenShift Playground: kostenlose Browser-basierte OpenShift-Umgebung
- Lokale Entwickler-Installation
- Rancher k3d [choco install k3d]: Runs Rancher Lab’s minimal k3s Kubernetes distribution via docker
- Rancher k3s: Lightweight Kubernetes, bspw. über k3sup [choco install k3sup]
- Rancher Desktop [choco install rancher-desktop]: Runs Kubernetes and container management on your desktop
- Enterprise Installation
- Browser
- KI-gestütztes Kubernetes-Management:
- K8sGPT: tool for scanning your kubernetes clusters, diagnosing and triaging issues in simple english
- Kubernetes Depoyment (with Package Manager, Dependencies, ...):
- HashiCorp Stack:
- Vagrant «Build&Test» [choco install vagrant] & Vagrant Cloud Box
- Packer «Package» [choco install packer]
- TerraForm «Unified Provision» [choco install terraform]
- Vault «Secure» [choco install vault]
- Consul «Connect&Maintain» & Consul Tools
- Nomad «Orchestrate&Run» [choco install nomad]
- Waypoint «Unified Deploy»
- Resilience4j: lightweight fault tolerance library inspired by Netflix Hystrix
- Arkade: Open Source Marketplace for Kubernetes
- Portainer Community Edition: Open Source Container Management for Personal Use
- cAdvisor: understand the resource usage and performance characteristics of containers
- Kube-nativ MicroService Frameworks
- Serverless:
- Val Town: run code instantly
- Apache OpenWhisk: Open Source Serverless Cloud Platform
- Knative: Google-sponsored Open Source Serverless Cloud Platform
- Scale to Zero:
- OpenFaaS-based Scale to Zero
- WSO2 Cellery: Scale to Zero with Kubernetes-based Knative
- KEDA: Scale to Zero with Kubernetes-based Event-Driven Autoscaler
- Geringe Cold-Start-Zeiten:
- DO: Rust [choco install rustup.install], Zig [choco install zig], WASM [choco install wasmedge]
- Sowie JavaScript/Node.js [choco install nodejs] v.a. wg. kleiner Lambda bundle size durch Tree-Shaking
- Und auch Python [choco install python] mit erstaunlich geringen Cold-Start-Zeiten
- DONT: Java, C# (und Vorsicht vor naivem Einsatz von Docker)
- DO: Rust [choco install rustup.install], Zig [choco install zig], WASM [choco install wasmedge]
- DevOps (inkl. SRE / Chaos Engineering)? vgl. Schwesterseite SWE » DevOps (!)
- Green Cloud:
- Kepler (=Kubernetes Efficient Power Level Exporter): energiebezogene Systemstatistiken, als Prometheus-Metriken exportierbar
- Weiterführende Quellen: Nubenetes / Nubenetes Other | Awesome Sysadmin | Awesome Chaos Engineering | Awesome AWS | Awesome Serverless | Awesome Lambda Essentials | Awesome Lambda Layers
- Post-Mortems: Kubernetes Failure Stories
Operations Research (OR) / Optimization
- Überblick/Werkzeuge-Einstieg
- Werzeuge: Newsletter OPTIMA 103 der Mathematical Optimization Society
- Benchmarks: for Optimizaton Software
- Solver für Lineare Programmierung
- Modelers
- Convex Optimization
- Optimization Frameworks
- In-Database Processing (ML)
- PostgresML
- Apache Flink ML
- Exasol UDF (u.a. Map/Reduce-Algorithmen, Python-Classification-Beispiel)
- Amazon Redshift ML
- Google BigQuery ML
- MindsDB
- ML-Extension to DBMS
- LLMs
- Modelle:
- Open Source: Webartikel 6 Best Open-Source LLMs to Watch Out For in 2024
- Dev:
- Java: Spring AI, LongChain4j
- Chatbots: perplexity.ai (mit „Focus: Academic”)
- Alternativen: OpenAI ChatGPT, HuggingChat, Andi, Microsoft Bing, Google Bard
- Multi-modale KI: Google Gemini
- Lokale LLMs: Jan.ai, Open WebUI
- Weiterführende Quellen: Awesome LLM
- Modelle:
- ML-Plattformen
- Desktop/Self-Hosting:
- IBM Watson Studio Desktop
- ClearML: Open-Source ML Plattform (Cloud | Self-Hosted)
- MLflow: Open-Source ML Plattform (Self-Hosted)
- Cloud:
- Kostenlose Angebote bei allen Cloud-Marktführern:
AWS ML und insb. AWS SageMaker, Azure ML, Google GCP AI & ML, ... - ClearML, wie oben bei Desktop bereits aufgeführt, auch mit einem Free-Tier-Angebot in der Cloud
- (€€€): Dataiku, u.a. in Kombination mit Snowflake
- Kostenlose Angebote bei allen Cloud-Marktführern:
- Desktop/Self-Hosting:
- MLOps-bezogen:
- (Die ganzen ML-Frameworks wie AWS SameMaker, IBM Watson, ClearML, MLflow haben auch alle integrierte MLops-Funktionalitäten, ...)
- Iterative Studio: Collaboration for Machine Learning Teams
- Iterative DVC: Open-source Version Control System for Machine Learning Projects
- Sacred: A tool to help you configure, organize, log and reproduce experiments
- Apache Marvin-AI: Open-Source MLOps Plattform
- Text Processing
- PyPDF2: convert simple, text-based PDF files into text readable by Python
- spaCy: free, open-source library for advanced Natural Language Processing (NLP) in Python
- nltk: suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning
- doccano: open source text annotation tool for humans (text classification, sequence labeling and sequence to sequence tasks)
- Weiterführende Quellen: Awesome NLP | Awesome Deep Learning for NLP | Awesome Sentiment Analysis
- ML-Quality:
- Giskard: Qualitätssicherungsmöglichkeiten mit Schwerpunkt auf Erklärbarkeit und Fairness
- KI-zentrischer Benchmark für Smartphone-HW: AI-Benchmark
- KI Repos: bspw. Hugging Face
- Robotik:
- Weiterführende Quellen: Awesome Robotics Libraries | Awesome Robotics
- Akademisch / State of the Art
- Repository Papers with Code
- Industrielle Forschung
- Nennenswerte internationale KI Labs: OpenAI (z.B. GTP-3, DALL·E, ChatGPT), Alphabet DeepMind (z.B. AlphaGo), Google AI (TensorFlow, LaMDA, Imagen), Facebook Artificial Intelligence Research (FAIR) = Meta AI (z.B. PyTorch), Tesla AI (z.B. autopilot), Ueber AI (z.B. Pyro)
- Nennenswerte kleine Labs (KI-Bildgeneratoren): stability.ai (Stable Diffusion), Midjourney (Midjourney Bot), Craiyon (früher: DALL-E Mini), artbreeder
- Weiterführende Quellen: Awesome AI | Awesome Deep Learning | Awesome AI-ML-DL | MLOps.toys | Awesome MLOps (and references) | Awesome Software Engineering for Machine Learning
Low-Code / No-Code
- DataRobots: Low-Code ML; mit einem „Academic Program”
- (€:) Amazon SageMaker, allerdings 2 Monate kostenlose Kontingente
- Manche zählen KNIME [choco install knime] auch als Low-Code ML Werkzeug
- OutSystems: Low-Code Application Building
- Amplication: Auto-generates an app based on TypeScript and Node.js (NestJS, Prisma, REST & GraphQL API, React Admin UI)
- Spezial-Kontext SAP:
- SAP Build Apps (ehem. AppGyver; technisch losgelöst von OpenUI5/SAPUI5)
- Weiterführende Quellen: Awesome low-code | Awesome Nocode / Lowcode | Mapping the no-code AI landscape
Edge / Fog / IoT
- Cloud Marktfüher: Amazon IoT Greengrass | Microsoft IoT Edge | Google Cloud IoT
- Nennenswert: NVIDIA EGX
- balenaEtcher [choco install etcher]: Flash OS images to SD cards & USB drives (u.a. für Raspberry Pi)
- balenaCloud: IoT Flotten-Management, u.a. für Raspberry Pi
- EdgeX: open source IoT Edge platform, with edge intelligence (AI/ML)
- Alternative: OpenRemote
- Eclipse IoT Projects: sehr viele Projekte, neben dem weitverbreiteten Mosquitto (MQTT) auch Cyclone DDS uvm.
- Eclipse Automotive Projects: bspw. software-defined vehicle (SDV) mittels Eclipse Leda
- Yocto Project (YT): create custom Linux-based systems / custom embedded Linux distributions
- Weiterführende Quellen: Awesome IoT & Hybrid | Awesome Edge Computing
- Substrate: Blockchain Framework, for multichains, designed to seamlessly connect to Polkadot
- HardHat: Ethereum development environment
- LBRY: blockchain-based file-sharing, social networks and video platform („open, free, and fair network for digital content”)
- DappRadar: Discover popular decentralized Apps
- Weiterführende Quellen: Awesome dApps | Awesome web3
- 2FA / RFC 6238? Authy [choco install authy-desktop] als One-Time Password (OTP) Authenticator
- OpenSSL [choco install openssl.light --ignore-dependencies]: Open Source toolkit for SSL/TLS
- KeyStore Explorer [choco install keystore-explorer.portable]: handle various X.509 certificates and KeyStore types (PKCS#12, BKS, UBER, JKS, JCEKS)
- Certify the Web [choco install certifytheweb --ignore-dependencies]: Easily manage SSL/TLS certificates from letsencrypt.org and other ACME Certificate Authorities
- User Authentication Platforms: Überblicksartikel zu Auth0 sowie Firebase Alternativen
- Wireshark [choco install wireshark]: Open Source Network Packet Analysis
- nmap [choco install nmap]: Open Source Network Scanning and Auditing
- Password4j: fluent cryptographic Java library for passwords
- Passwort-Listen: SecList-Sammlung | SkullSecurity-Sammlung | haveibeenowned-Downloader | weitere...
- Hack the Box: kostenloser Cloud-basierter Hacking Playground
- Tenable Nessus Essentials (kostenlos für 16 IPs): Vulnerability Assessment im Netzwerk
- Sowie für Studierende und Dozenten die Option: Tenable Essentials for Education
- Alternative: OpenVAS
- Security Technical Implementation Guides (STIGs): a configuration standard consisting of security requirements for a specific product
- SCC SCAP-Automation-Tool [choco install scap-compliance-checker], sowie STIG-Dateien 1) für automatisierte Ausführung (SCAP) und 2) manuelle Ausführung (Document Library) sowie STIG Viewer [choco install stigviewer]
- Threat Modeling: OWASP Threat Dragon | Microsoft Threat Modelling Tool (TMT)
- BurpSuite Community Edition [choco install burp-suite-free-edition]: web security testing
- Nikto2: Open source suite for comprehensive tests against web servers
- Puma Scan: secure code analysis tool for .NET Core projects
- Security Code Scan: Detects various security vulnerability patterns in .NET Core projects
- Docker Bench Security: script that checks for dozens of common best-practices
- ScoutSuite: multi-cloud security-auditing tool
- snyk (formerly DeepCode): find and fix vulnerabilities in code and containers
- Trivy: Versatile Security Scanner (i.a., Container)
- git-Hygiene (git Secrets Scanning)? vgl. Abschnitt git auf der Schwesterseite (TruffleHog, Gitleaks, GitGuardian , BFG Repo-Cleaner, etc.)
- Chaos Engineering? vgl. Abschnitt DevOps auf der Schwesterseite (Pumba, Netflix Chaos Monkey / Simian Army, etc.)
- Anti-SQL-Injection: sqlmap
- Autopsy [choco install autopsy]: Forensik-Werkzeug, als GUI für The Sleuth Kit
- Mobile Verification Toolkit (MVT): Mobile Forensics Tool (für iOS und Android)
- Kostenlose Alternativen: Oxygen Forensic Viewer
- Kommerzielle Alternativen: OpenText EnCase, SFP Pro, ...
- Weiterführende Quellen: Awesome Cybersecurity Blueteam | Awesome Security | Awesome Web Security | Awesome Security Hardening | Awesome DevSecOps | Awesome Container Security | Kubernetes Security | Open Source Tools for AWS Security | Awesome Embedded and IoT Security | Awesome Forensics | Awesome Incident Response
- Passwort-Generator: XKPasswd, integriert in KeePass 2 [choco install keepass], etc. pp.
- Password Cards: PasswordCard.org | Password Cards by Savernova | Password Cards by helight.com
- Passwortlisten-Selbstcheck:
- Kontinuierliches Monitoring: Troy Hunt Have I Been Pwned, Firefox Monitor
- Report: Hasso-Plattner-Institut HPI Identity Checker (einmal pro Tag)
- Querying: search.0t.rocks, breachdirectory.org, (€: DeHashed, snusbase.com, und andere)
- Anti-Virus: Mehrere kostenlose Anti-Virus-Möglichkeiten, u.a. Panda Free Antivirus [choco install pandafreeantivirus]
- 0patch [choco install 0patch]: micropatches to fix software vulnerabilities in various, even closed source products
- HardeningKitty: supports guidelines from Microsoft, CIS Benchmarks, DoD STIG and BSI SiSyPHuS Win10
- hardentools [choco install hardentools]: collection of simple utilities designed to disable a number of "features" exposed by Microsoft Windows
- Portmaster [choco install portmaster]: open-source application that puts you back in charge over all your computer's network connections
- PGP / GnuPG? gpg4win [choco install gpg4win], v.a. Kleopatra sowie GnuPG, GpgEX, GPA, GpgOL
- E-Mail Encryption: openpgp.org Übersicht
- Dezentralized E2E-encrypted Instant Messaging?
- XMPP (aka Jabber): Software-Liste, insbesondere Conversations (Android-Client) und wiuwiu (Web-Client und Hosting)
- (Matrix? Software-Liste u.a. für Clients und Hosting => Better-than-WhatsApp but still with several severe Data Privacy problems / GDPR problems => Vector status blog)
- Checker:
- IsLegitSite oder ScamAdvisor: Plausibilisieren Sie, ob eine Website legal ist oder ein Betrug, überprüfen Sie den Ruf der Website
- Betriebssysteme
- Desktop: Qubes OS (Bachelolarbeit: Evaluation)
- Android: GrapheneOS
- Sandboxes:
- Mail Attachments: Dangerzone (inspiriert von Qubes OS trusted PDF)
- Generische Anwendungen: Sandboxie Plus [choco install sandboxie-plus.install], Microsoft Windows Sandbox, [Enable-WindowsOptionalFeature -FeatureName "Containers-DisposableClientVM" -All -Online]
- Mobiltelefon vs. Custom Firmware
- mAid (= Manage Android): Linux Distribution zur Wartung von Mobiltelefonen (früher bekannt als „FWUL” = „Forget Windows Use Linux”), u.a. für adb und fastboot
- Anonimatron: Open-Source Data Anonymization
- DataBunker: Open-Source Data Protection Platform
- Alternative: (€) bspw. Protegrity
- Kodex Community Edition: Open-Source Toolkit for Privacy and Security Engineering
- Privacy vs. Machine Learning:
- Weiterführende Quellen: Awesome Privacy Engineering | Awesome GDPR #1 | Awesome GDPR #2
- Open-Source Intelligence (OSINT): Awesome OSINT
- Have I been Pwned?: Check if your email or phone is in a data breach
- Have I been Trained?: Check if a picture is in an AI model
- privacy.sexy: (Personal) Windows Hardening
- PrivaZer [choco install privazer.install]: Free PC cleaner & Privacy tool that cleans unwanted traces
- eBlocker: (Personal) Web Privacy Protection
- Tor Browser [choco install tor-browser]: explore the internet with privacy
- Quad9: Log-free GDPR-compliant DNS
- AdGuard DNS: Block Ads via DNS (z.B. in Smart TVs und IoT-Gerätern, immer dann wenn keine eBlocker Trusted Root-CA installierbar ist)
- Alternativen:
- Privacy Badger: browser extension to block invisible trackers
- Checker:
- tosdr.org: Terms of Service Didn't Read
- AGB Check-Tool: Prüfen Sie, ob Ihre AGB nachteilige Klauseln enthalten
- Privacy Policy Checker: Prüft eine Website-Datenschutzrichtlinie auf Übereinstimmung mit der GDPR-Verordnung
- tosdr.org: Terms of Service Didn't Read
- E-Mail Accounts: Tutanota (aus Hannover, kostenlose 1GB), Proton (aus der Schweiz, kostenlose 1GB)
- Anonyme Einweg-Mail / 10-Minute-Mail: temp-mail.io (Browser-Ext., u.a. Opera), temp-mail.org, (Browser-Ext., u.a. Opera), FakesMail (Browser-Ext., u.a. Opera), tempr.email (aus DE, aber ohne Browser-Integration), uvm.
- E-Mail-Forwader: ManyMe (ohne Browser-Integration), TrashMail (Browser-Ext., u.a. Opera), etc. pp.
- Auto-Unsubscribe Newsletter: unsubscribe-gmail, hatchet
- (Im Kontext eines Gmail-Accounts benötigen praktisch alle Werkzeuge, außer unsubscribe-gmail, eine aktive 2FA des Gmail-Kontos)
- Kostenbehaftete aber empfehlenswerte Alternative (€): Leave Me Alone
- Kostenlose Alternativen, aber diese Werkzeuge selbst sind DSGVO-problematisch (Dienstleister kriegt Zugang zum Konto und erhebt Statistiken, welche vermarktet werden): Unroll.me, Cleanfox [Eigentlich ist nur deren Namen zu kennen wichtig, dadurch kann man per MetaGer-Suche nach Alternativen zu Unroll.me suchen und dann so etwas wie Leave Me Alone finden...]
- Data Privacy Management
- sdelete [choco install sdelete --version=]: Sicheres Löschen von Dateien
- (ich empfehle die Version 1.61; aber Obacht: die Parameter-Semantik hat sich zur 2.0 geändert, in 1.61 wird „-c” für „zero free space” verwendet bspw. „sdelete -c C: -nobanner”)
- ExifTool [choco install exiftool]: reading, writing and editing meta information (many supported file types)
- BatchPurifier: kostenpflichtiges aber wertvolles Werkzeug zur Metadaten-Tiefenreinigung („Sanitize”) von Büro- und Multimedia-Dateien
- Auch für den persönlichen Gebrauch (~$19), ABER VORSICHT: "The number of computers on which you may activate this software may not exceed the number of computer licenses that you have purchased. Once a license is activated, it's tied to the specific computer and cannot be transferred to another. Regardless of the circumstances." (Also muss man bei einem Hardware-Wechsel seines PCs eine neue Lizenz kaufen; preislich auch privat machbar, aber seien Sie vorsensibilisiert, denn dieses Modell sind End-User nicht gewöhnt.)
- Weiterführende Quellen: Privacy Tools | Awesome Privacy #1 | Awesome Privacy #2 | Awesome Privacy #3