Beste art um Kombinationen zu programmieren?

Moin!

Was ist die effizienteste Methode, wenn man mit Kombinationen programmieren will? Und welche Programmiersprache?

Ist eine Datenbank das schnellste?

Ich kenne mich leider kaum aus...

Ich kann es ja kurz anreissen, was ich machen will.

Es sollen zb 100 textdatein geladen werden. In diesen sind circa à 300.000 zeilen mit zahlen. Insgesamt gibt es aber nur 500.000 verschiedene zahlen. Nun möchte ich das immer 15 Datein zusammengefügt werden.

Wenn zb 6 Datein die volle Zahl von 500.000 erreichen, wird dort nicht weiter kombiniert.

Ich möchte so heraus finden, welche 15 Datein unter 500.000 bleiben.

Ich hoffe es ist verständlich in abgespeckter form😁

Lg!

Erzesel

09.04.2023, 01:01

Können die Zahlen sortiert werde oder muss deren Reihenfolge erhalten bleiben?

Handelt es sich um ganze Zahlen (Integer) ?

Vorzeichen?

Ranjahh

Fragesteller

09.04.2023, 01:43

Ja ich kann sie vorher alphabetisch sortieren und es sind keine doppelten in einer Textdatei.

Also besser wäre das auf zeilen zu machen, eine Zahl = eine Zeile.

Erzesel

09.04.2023, 01:21

PS:

Sind die Zahlen in Textform aufgelistet (menschlich lesbar/decimal) , oder im Binärformat?

Wie groß ist die größte Zahl?

Ranjahh

Fragesteller

09.04.2023, 01:43

Eine Zahl sieht zb so aus: [01][02][43] das wäre dann eine 010243. Ich wollte keine konkrete Hilfe, deswegen habe ich es nicht so ausgeführt!😋

4 Antworten

W00dp3ckr

08.04.2023, 23:54

Mache ich also mal mit beim lustigen Raten…

Du hast Dateien die Zahlen enthalten. Über alle Dateien hinweg gibt es 300.000 eindeutige Zahlen. Du möchtest jetzt eine Datei lesen (Datei_1), und bestimmen, welche eindeutigen Zahlen drinnen sind. Danach liest Du die nächste (Datei_2) und bestimmst, welche eindeutigen Zahlen sie enthält, die nicht in Datei_1 enthalten sind… Das tust Du so lange, bis Datei_1,…,Datei_n insgesamt alle unterschiedlichen Zahlen enthalten. Damit wird Datei_1,…,Datei_n eine Gruppe von Dateien. Jetzt beginnt das gleiche Spiel mit Datei_(n+1), Datei_(n+2) und so fort.

Sehr viele Sprachen können so etwas, beispielsweise Python.

Ranjahh

Fragesteller

09.04.2023, 01:29

Ja circa 300.000 könnte aber auch mehr oder weniger sein.

Der Rest passt.

Wie baut man sowas auf? Den die Kombinationen gehen ja in die zich zich zich Milliarden!

Schachpapa

09.04.2023, 02:43

@Ranjahh

die Kombinationen gehen ja in die zich zich zich Milliarden!

Wieso? 1-15 bilden eine Gruppe, 16-30 die zweite, 31-45, 46-60, 61-75, 76-90, 91-100. Ich komme da nur auf 7 Dateien mit jeweils maximal 500.000 Zeilen. Das ist doch nix besonderes und läuft in weniger als einer Minute durch.

Oder du hast dich falsch ausgedrückt und meinst etwas anderes.

W00dp3ckr

09.04.2023, 09:26

@Schachpapa

Interessanter wird es, wenn man ein Optimalitätskriterium hat. Dafür müsste man einen Index aufbauen.

Ranjahh

Fragesteller

09.04.2023, 12:24

@Schachpapa

Es geht ja um Kombinationen, nicht um feste Gruppen, 1-15 war nur ein Beispiel.

Nach dem kombinieren von 1-15 kommt 1-14 + 16, dann 1-14 +17 Etc..

Aber das fällt alles weg, wenn 1-10 schon voll sind.

W00dp3ckr

09.04.2023, 12:27

@Ranjahh

Ja, 15 aus 100 ist schon allein prohibitiv viel. Daher musst Du intelligenter vorgehen. Und darum musst Du Dich mit jemandem zusammensetzen, der Programmieren kann und das Problem verstehst, das Du versuchst zu lösen.

W00dp3ckr

09.04.2023, 09:45

Nehmen wir also an, Du möchtest, dass die Dateiengruppen von 15 Dateien in dem Sinne optimal sein sollen, dass sie jeweils die maximale Zahl von Zahlen enthalten (einige vollständig, andere unvollständig), dann musst Du einen Index aufbauen. Der Index enthält, welche Zahl in welchen Dateien vorhanden ist. Damit kannst Du dann sehr schnell die Frage beantworten, wie viele Dateiengruppen Du maximal erstellen kannst, die alle Zahlen enthalten. Du kannst auch “fail first” suchen, d.h. Du nimmst die Zahl, die am seltensten vorkommt, nimmst die erste Datei, die diese enthält, und dann suchst Du dazu jeweils die Datei, die den geringsten Überlapp hat. So gehst Du vor, bis Du eine Gruppe voll hast. Dann nimmst Du das nächste unbenutzte Dokument in der Liste.

Das würde vielleicht zu einer “guten” Lösung führen. Insgesamt halte ich das Problem für NP-hart.

Erzesel

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

programmieren, Programmiersprache, Programmieren & Softwareentwicklung

09.04.2023, 10:25

trivial

ich mach mir nicht die Mühe [01][02][43] erst in eine Zahl umzuwandeln is sortiere einfach di strings Du willst ja ohnehin nur wissen vieviel Elemente übrig bleiben....

Mit Millionen Datenzeilen aus Dateien zu agiern ist in jeder Sprache eine "Hausnummer" Was das Programm im Speicher tut, ist weniger das Problem als das Lesen der Dateien!

Iteriere über die gewünschten Dateien

füge alle Zeilen der aktuellen Datei einem Buffer hinzu.
sortiere die Zeilen ohne Duplikate (je nach Sprache: "sort unique" , ".Distinct(), etc )
prüfe mit Array.Count/List.Count oder ~.Size (verschieden in jeder Sprache) wieviel Elemente (Zeilen) in der Liste sind
Sind es weniger Elemente als der vorgegebene Wert merkst du Dir die bisher gelesenen in einem 2. Buffer und machst mit der nächsten Datei weiter
ist die Vorgabe überschritten kannst ist die Sache erledigt

..den 2.Buffer kannst du dann in in eine Datei deiner Wahl schreiben oder was auch immer.

mal das Auswerden eines Blocks von 15 Dateien

Statt nutzlosem Pseudocode...

Quick&Dirty in Powershel (Get-Content ist nicht unbedingt ein Rennpferd beim Lesen von großen Dateien , aber für ne Demo übersichtlicher) :

$StopFlag=$False
$BaseNum=0
$WriteBuffer=@()
$BaseNum..($BaseNum+14)|
    ?{$StopFlag -eq $False}| #solange keine Abbruchbedingung
    %{$ReadBuffer=@()}{
        $FileName='file{0:d3}.txt'-f $_  #zu lesenden Dateinamen  aus de jeweils übergenebeb Dateinummer zusammenbasteln (file000.txt, file000.txt ...usw)
        Write-Host "Fuege $FileName zum Buffer"
        $ReadBuffer+=Get-Content $FileName -ReadCount 0
        $ReadBuffer=$ReadBuffer|Sort-Object -Unique
        Write-Host "Einzigartige Strings in ReadBuffer: $($ReadBuffer.Count)" -fo blue
        if ($ReadBuffer.Count -lt 500000) {
            Write-Host "ubernehme  ReadBuffer in WriteBuffer" -fo green
            $WriteBuffer=$ReadBuffer  #in 2.Buffer...Kopieren
        }
        else {
            $StopFlag=$True  # Loop abbbrechen
            Write-Host "Maximum Strings ueberschritten" -fo red
            Write-Host "ReadBuffer verworfen" -fo red
        }
    }
  $writebuffer.count

Schachpapa

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Mathematik

08.04.2023, 23:04

Ich glaube, wenn du dein Problem verständlich formulieren kannst, ist die Lösung nicht mehr fern.

Es sollen zb 100 textdatein geladen werden. In diesen sind circa à 300.000 zeilen mit zahlen. Insgesamt gibt es aber nur 500.000 verschiedene zahlen. Nun möchte ich das immer 15 Datein zusammengefügt werden.

Also 300.000 Zahlen pro Datei? Nach welchen Kriterien sollen jetzt 15 Dateien zusammengefügt werden? Wie sieht so eine Zusammenfügung aus?

Ranjahh

Fragesteller

08.04.2023, 23:20

Sie werden einfach zusammen gefügt. So als würde man alle Zeilen aller 15 Datein in eine rein tun ,doppelte zeilen werden überschreiben

Schachpapa

08.04.2023, 23:45

@Ranjahh

Nun möchte ich das immer 15 Datein zusammengefügt werden.

Wenn zb 6 Datein die volle Zahl von 500.000 erreichen, wird dort nicht weiter kombiniert.

Was immer du damit bezwecken magst ...

Du nimmst also Datei 1 mit 300.000 Zahlen, fügst aus Datei 2 alle Zahlen zu, die nicht bereits drin sind, dann Datei 3 usw. bis du entweder Datei 15 verwendet hast oder die Zieldatei 500.000 Zahlen enthält? Wenn das bei Datei 10 erreicht ist, werden 11-15 ignoriert?

Stellst du an das Format der Zieldatei irgendwelche Anforderungen? Oder enthält sie einfach nur Zahlen?

Ranjahh

Fragesteller

09.04.2023, 00:06

@Schachpapa

Ja genau, so wie du es beschrieben hast.

Die zieldatei soll einfach nur zahlen wieder geben, also das was in den zeilen steht.

Ranjahh

Fragesteller

09.04.2023, 00:13

@Ranjahh

Ja genau, so wie du es beschrieben hast.

Die zieldatei soll einfach nur zahlen wieder geben, also das was in den zeilen steht.

Es sind nämlich nicht die zahlen von 1-500.000 sondern zb von 1mio - 5mio. Die Anzahl werden durch eine Datei vorgegeben. Deswegen wäre es am besten, wenn eine zusatz Datei als Vorlage dafür dient, was der " rahmen" ist.

Also quasi den Rahmen der 500.000 stellt, deswegen ist es besser das auf zeilen Ebene zu machen.

ralphdieter

Von gutefrage auf Grund seines Wissens auf einem Fachgebiet ausgezeichneter Nutzer

Mathematik, Programmiersprache

10.04.2023, 14:37

Mir ist immer noch nicht klar, was Du willst.

Du hast offenbar eine Menge D={ D_1, D_2, ... } von Dateien, die je als eine Menge D_i von Zeilen gesehen werden können. Du kennst die Menge Z aller möglichen Zeilen. Und Du suchst jetzt nach Gruppen aus 15 Dateien, deren Vereinigung nicht Z ist. Brauchst Du da:

eine beliebige solche Gruppe?
alle möglichen Gruppen? Das könnten sehr viele sein!
eine Zerlegung aller Dateien in solche Gruppen? Dann bleibt aber immer ein Rest, weil 100 nicht durch 15 teilbar ist.

Ich würde solche Datenmengen in Python verarbeiten und für jede Zeile eine Menge der Dateien verwalten, die diese Zeile enthalten. Diese Mengen kann man effizient als Integer abbilden, wobei jedes Bit einer Datei entspricht:

from os import listdir

# lineinfo: line --> files (as Bit-Set)
lineinfo = { (line, 0) for line in open("all.txt") }

index = 1 # 2, 4, 8, ... 2^n
datainfo = {} # index --> filename
for data in listdir("input"):
    datainfo[index] = data
    for line in open(data):
        lineinfo[line] |= index # total count
    index *= 2

Wenn danach irgendeine Zeile in höchstens 85 (=100−15) Dateien vorkommt, sind beliebige 15 Dateien aus dem Rest eine mögliche Lösung. Andernfalls (wenn alle Zeilen mindestens 86-mal vorkommen) gibt es keine Lösung:

for line, lineset in lineinfo.items():
    int count = 0
    int idx = 1
    while idx<index:
        if not lineset & idx:
            count += 1
    if count >= 15:
        int idx = 1
        while idx<index:
            if not lineset & idx:
                print( datainfo[idx], end=", " )
        break

Etwas schwieriger wird es, alle möglichen Gruppen zu enumerieren. Eigentlich zählt jede Gruppe von 15 Dateien (wie oben) für jede Zeile. Allerdings werden dabei Gruppen mehrfach gezählt, wenn in deren Vereinigung zwei oder mehr Zeilen fehlen. Es ist sicher nicht praktikabel, sich alle schon berechneten Gruppen zu merken, um Doubletten zu vermeiden, denn das sind viel zu viele.

Prinzipiell kann man erst mal alle Zeilen ignorieren, die in 86 oder mehr Dateien vorkommen (weil die in jeder Gruppe vorkommen), und dann die Dateien aussortieren, die in der Schnittmenge der übrigen Zeilen liegen. Das dürfte die Datenmenge gewaltig verkleinern.

Wie man aber genau vorgeht, hängt davon ab, ob Du zwei verschiedene Dateigruppen mit gleicher Vereinigungmenge unterscheiden willst:

Wenn nicht, kannst Du iterativ für jede interessante Zeile z_i alle Lösungen finden, die z_i nicht enthalten und danach nur Lösungen betrachten, die z_1 bis z_i enthalten. Das sollte eigentlich recht flott gehen.
Falls doch, müsste man noch etwas knobeln, um nicht über alle möglichen 15-er-Gruppen iterieren zu müssen ...

Moin!

Ich habe mehrere Textdatein, in denen verschiedene Werte drin stehen, aber auch viele doppelte in sich tragen

Ich möchte nun wissen, wie oft jeder Wert vorkommt.

Gibt es die Möglichkeit das man irgendwie alle datein in ein program läd und diese dann gescannt werden?

oder kann man evtl alle Werte in eine datei eintragen und dann nach häufigkeit sortieren? Gibt es da vielleicht was gutes in Notepad++?

Vielen dank! jede Idee ist erwünscht, programmieren kann ich nicht :)

lg!

...zur Frage

Zufällige Kombination aus einer gewissen Anzahl an Datein möglich?

Moin!

Ich suche irgendeine Möglichkeit aus 70 Text Datein 35 zufällige auszuwählen.

Und dies zb 30x passieren, also mit 30 Unterschiedlichen Kombinationen, aber immer aus diesem 70 Datein.

Diese sollen dann zb in ordern gesammelt werden mit dem Namen 001,002,003 Etc...

Hat jemand irgendwie ein Rezept dafür?

Geht sowas vielleicht mit powershell oder so?

...zur Frage

Wie viele Kombinationen fallen weg?

Moin,

Wie viele Kombinationen fallen bei folgendem Beispiel weg? Und wie berechnet man das?

wenn ich zb 100(1-100) zahlen habe und ich möchte alle Kombinationen ohne Wiederholung daraus erhalten die jeweils 15 stück gross sind, dann sind das doch 253.338.471.349.988.640 Kombinationen insgesamt oder?

Wie viele Kombinationen fallen weg, wenn zb. Eine 10er Kombination, komplett raus soll?

Zb alle Kombinationen, welche 1 2 3 4 5 6 7 8 9 10 in sich tragen kommen weg, wie viele bleiben dann übrig?

Lg!

...zur Frage

40 zahlen - wieviele kombinationen möglich?

Hi,

wenn ich 40 zahlen habe, wie kann man errechnen, wie viel kombinationen man daraus machen kann ??

bei 3 sind es ja zB 9 ... aber bei 40 kann ich das irgendwie nicht mehr im kopf rechnen xD ...

hilfe wäre nice

...zur Frage

Sql Abfrage: Mitarbeiter mit höchster Zulage?

Hi zusammen, ich brauche für eine kleine SQL abfrage eure hilfe.

gefordert wird die Mitarbeiter herauszufinden, die die höchste zulage erhalten im Vergleich zu den Mitarbeitern mit gleichem Gehalt

A: 1000€ Gehalt 50€ Zulage

B: 1000€ Gehalt 20€ Zulage

C: 500€ Gehalt 70€ Zulage

D: 500€ Gehalt 120€ Zulage

jetzt brauch ich eine Abfrage die mir A und D ausgibt.

danke für eure Hilfe :)

...zur Frage

Zahl mit Arduino an MySQL Datenbank senden?

Moin,

Vielleicht kann mir jemand helfen. Ich will, dass mein Arduino den Wert einer stinknormalen Variable an eine MySQL-Datenbank schickt. Ich bin mehr oder weniger am Verzweifeln, weil mir niemand helfen kann... Es kann doch nicht so schwer sein, ne blöde Zahl irgendwie in Form einer Variable an die Datenbank zu senden...

Ich benutze einen normales Arduino Uno, und ein W5100 ethernet shield

Mein bisheriger Ansatz war so: (Logindaten der Datenbank entfernt)

#include <Ethernet.h>

#include <MySQL_Connection.h>

#include <MySQL_Cursor.h>

byte mac_addr[] = { 0xDE, 0xAD, 0xBE, 0xEF, 0xFE, 0xED };

IPAddress server_addr('localhost');

char user[] = "root";

char password[] = "secret";

// Sample query

char INSERT_SQL[] = "INSERT INTO Test (Sensor) VALUES ('3')";

EthernetClient client;

MySQL_Connection conn((Client *)&client);

void setup() {

Serial.begin(115200);

while (!Serial);

Ethernet.begin(mac_addr);

Serial.println("Connecting...");

if (conn.connect(server_addr, 3306, user, password)) {

delay(1000);

}

else

Serial.println("Connection failed.");

}

void loop() {

delay(2000);

Serial.println("Recording data.");

MySQL_Cursor *cur_mem = new MySQL_Cursor(&conn);

cur_mem->execute(INSERT_SQL);

delete cur_mem;

}

...zur Frage

Tabelle nach SQL-Eintrag aktualisieren?

Hallo!

Ich habe mir ein Tool gebaut, welches Namen von einem SQL-Server holt und anzeigt. Das ganze habe ich schon verwendet, aber dann habe ich mir gedacht, dass es besser wäre wenn ich die Namen auch anhaken könnte. Das hab ich so programmiert aber dann ist mir etwas aufgefallen. Um die Daten aus dem SQL-Server zu aktualisieren habe ich folgendes verwendet:

<meta http-equiv="refresh" content="30">

Dadurch werden die Häkchen jetzt immer wieder gelöscht. Wie könnte man dieses Problem lösen?

...zur Frage

Kann ich das Programm ohne 2 Schleifen schreiben?

Man kann ja zwei schleifen machen einmal für die jeweilige Zeile und dann für die jeweiligen Spalten bzw Anzahl der Zeichen der Zeile

(Syntax kann falsch sein da ich C lange nicht mehr hatte)

würde es aber auch gehen wenn man ne Schleife macht von i=0 bis i< 5 und dann ein String erstellt und dann pro Durchlauf den String um ein * erhöht

also so char[5] s;

und dann in der Schleife immer um 1 ergänzt

s[i] = ‚*‘;

oder man könnte doch auch mit einem String anfangen der eine Länge von 1 hat und dann die Länge erhöhen und dann immer hinzufügen

und dann den String immer Printen

Also nur aus Interesse

...zur Frage

Ich suche ein Program für Kombinationen?

Gibt es ein Programm, am besten zum donwloaden, in dem man Kombinationen ausgeben kann?

Mein Wunsch wäre, das ich quasi mehrer Zahlen reihen eingeben kann,

Zahlenreihe 1: 5 6 8

Zahlenreihe 2 : 3 1 7

Zahlenreihe 3 : 8 9 1

und aus dieser Zahlenreihe werden alle Kombinationen erstellt wobei aus jeder Reihe, immer nur eine Zahl entnommen wird, also zb :

5 3 8 oder 8 1 1 oder 6 7 9.

Wäre richtig gut wenn mir jemand da helfen kann!

lg!

...zur Frage

SQL Tabelle in Java Class?

Hallo, ich habe eine SQL Tabelle und ein Java Class. Wie kann ich jeden Tabellen Eintrag in eine Java Class eintragen?

Also quasi so:

for (SQLTabellenEintrag eintrag : Tabelle.alleSQLTabellenEinträge){
  JavaKlasse javaKlasse = new JavaKlasse(Spalte1, Spalte2, etc)
}

...zur Frage

Wie viele Wörter hat die Arabische Sprache?

Laut dem Internet, hat die deutsche Sprache von 300.000 bis 500.000 Wörter und die Englische Sprache soll über 1.000.000 Wörter haben.

Ich selbst bin Araber und mich würde gerne Interessieren wie viele Wörter die arabische Sprache hat, da ich gehört hab dass sie den größten Wortschatz hat. Aber leider hab ich im Internet keine richtigen Zahlen gefunden.

DANKE im Voraus und

Silverflash

...zur Frage

Brauche Zwei SQL Join Aufgabestellungen, welche Vorschläge habt ihr?

Hallo, ich brauch für meinen Lehrer in der Schule bis morgen zwei Nichttriviale Aufgabenstellungen für den SQL Join (spielt keine Rollen welcher Join), aber wir machen das mit Oracle iAcademy (kein MySQL, sondern Normales von Oracle), also bitte bei den Aufgaben Employees haben. Im Internet finde ich solche Beispiele leider nicht, die entweder, diese Oracle Tabellen (siehe unten) nicht verwenden oder zu einfach sind.

So sehen diese aus:

Und die Aufgaben von mir, wird ein anderer Machen und ich einen von einem anderen Schüler, dass wird vom Lehrer entschieden, wer von welchen die Aufgaben macht.

Also was habt ihr für Vorschläge? Aufgaben sollten nicht leicht sein.

Danke LG

...zur Frage

Python: Zufällige Buchstaben & Zahlenkombinationen?

Hallo alle zusammen

Ich bin ein Anfänger im Programmieren und bräuchte dringend ein Programm, mit dem ich verschiedene Kombinationen von Zahlen und Buchstaben generieren und auch ausdrucken kann, z.B uwod3, 28a9f usw. Dabei soll die Länge nicht grösser sein als 5 Zeichen.

Wäre cool wenn ihr mir helfen könntet

...zur Frage

Wie viele Kombinationen gibt es bei einem 4 stelligen Code mit 7 möglichen Zahlen?

Ich habe ein Rätsel für euch.

Gegeben sind 7 mögliche Zahlen die in einem vierstelligen Code vorkommen können.

Mindestens eine Zahl kommt von 1,4,7. Null kann auch vorkommen. Von den Zahlen 9 und 6 kann auch eine Zahl kommen wobei 3 am Ende ganz sicher ein oder zweimal vorkommt. Zb. 1403 oder so.

Also man hat die Zahlen 1,4,7,0,9,6,3 gegeben.

Was auch zu beachten ist, ist das wenn zb. 7 an erster Stelle steht, es nicht mehr möglich ist 1 oder 4 an zweiter Stelle zu setzen. Also es gibt eine Art "Reihenfolge" wie oben beschrieben.

Jetzt zur Frage wie viele Kombinationen gibt es.

LG Paul S.

...zur Frage

Was möchtest Du wissen?

Deine Frage stellen