Add files via upload

Cardman08 · web-flow · commit bef50b5043f5 · 2025-05-21T09:55:12.000+02:00
diff --git a/app.R b/app.R
@@ -0,0 +1,228 @@
+####
+# Version: 0.10.2
+# Author:  Christian Jaeger (christian.jaeger@uk-halle.de)
+# 20250312
+####
+
+## Main Changes:
+# 0.10.2 Added Export Button
+################
+
+## Beschreibung:
+# Diese Shiny-App ermöglicht das Hochladen und Zusammenführen von zwei CSV- oder TXT-Dateien.
+# Falls die Dateien keine Spaltennamen enthalten, können diese aus einer zugehörigen SQL-Dump-Datei extrahiert werden.
+# Der Nutzer kann auswählen, welche Spalten als ID für den Merge-Prozess verwendet werden sollen.
+# Zudem kann zwischen verschiedenen Join-Typen (Inner, Outer, Left, Right) gewählt werden.
+# Das zusammengeführte Ergebnis wird als interaktive Tabelle angezeigt und kann als CSV-Datei gespeichert werden.
+# Optional kann der Nutzer einen eigenen Dateinamen für den Export vergeben.
+################
+
+library(shiny)
+library(readr)
+library(writexl)
+library(stringr)
+library(DT)
+library(shinyjs)
+
+extract_column_names <- function(sql_file) {
+  sql_text <- readLines(sql_file, warn = FALSE)
+  table_start <- grep("CREATE TABLE", sql_text)
+  if (length(table_start) == 0) return(NULL)
+  
+  sql_text <- sql_text[(table_start + 1):length(sql_text)]
+  table_end <- grep("\\) ENGINE", sql_text)[1]  # Ensure capturing all column definitions
+  if (is.na(table_end)) return(NULL)
+  
+  column_lines <- sql_text[1:(table_end - 1)]
+  column_names <- str_extract_all(column_lines, "`([^`]*)`")
+  column_names <- unlist(column_names)
+  column_names <- column_names[!is.na(column_names)]
+  column_names <- gsub("`", "", column_names)
+  
+  return(column_names)
+}
+
+clean_column_names <- function(col_names) {
+  col_names <- make.names(col_names, unique = TRUE)
+  col_names <- gsub("\\.+(\\d+)$", "", col_names)  # Entfernt ...[Zahl] komplett
+  return(col_names)
+}
+
+rename_columns <- function(df, file_name) {
+  file_suffix <- tools::file_path_sans_ext(basename(file_name))
+  colnames(df) <- paste0(clean_column_names(colnames(df)), "_", file_suffix)
+  return(df)
+}
+
+# UI der Shiny-App
+ui <- fluidPage(
+  useShinyjs(),
+  tags$head(tags$title("CSV/SQL - Merger - DIZ & Biomedical Data Science")),
+  titlePanel(
+    div(
+      tags$img(src = "Logo_DIZ_DE.jpg", height = "80px", style = "margin-right: 10px;"),
+      div(
+        h1("CSV/SQL - Merger für File Preprocessings - 0.10.2", style = "margin-bottom: 0px;"),
+        h4("Ein Service des Datenintegrationszentrums (DIZ) und der AG (Bio-) Medical Data Science", 
+           style = "margin-top: 5px; color: gray; font-weight: normal;")
+      )
+    )
+  ),
+  
+  sidebarLayout(
+    sidebarPanel(
+      checkboxInput("has_headers1", "Datei 1 enthält Spaltennamen", value = FALSE),
+      
+      fileInput("file1", "Lade CSV- oder TXT-Datei 1 hoch", accept = c(".csv", ".txt")),
+      fileInput("sql1", "Lade zugehörige SQL-Dump-Datei 1 hoch", accept = ".sql"),
+      hr(),
+      checkboxInput("has_headers2", "Datei 2 enthält Spaltennamen", value = FALSE),
+      fileInput("file2", "Lade CSV- oder TXT-Datei 2 hoch", accept = c(".csv", ".txt")),
+      fileInput("sql2", "Lade zugehörige SQL-Dump-Datei 2 hoch", accept = ".sql"),
+      
+      uiOutput("select_id1"),
+      uiOutput("select_id2"),
+      
+      hr(),
+      selectInput("join_type", "Join-Typ auswählen:", 
+                  choices = list("Inner Join" = "inner", 
+                                 "Outer Join" = "outer", 
+                                 "Left Join" = "left", 
+                                 "Right Join" = "right")),
+      actionButton("merge", "Merge-this-IDs"),
+      hr(),
+      textInput("filename", "Name der Datei: (optional)", value = ""),
+      downloadButton("download", "Download Merged CSV"),
+      downloadButton("download_excel", "Download Merged Excel"),
+      hr(),
+      tags$a(href = "readme.html", "Dokumentation öffnen", target = "_blank"),
+      br(), br(),
+      h4("Kontakt"),
+      tags$p("Fragen? Schreiben Sie an: "),
+      tags$a(href = "mailto:christian.jaeger@uk-halle.de", "christian.jaeger@uk-halle.de"),
+    ),
+    mainPanel(
+      h3("Vorschau der Dateien"),
+      fluidRow(
+        column(6, DTOutput("preview1")),
+        column(6, DTOutput("preview2"))
+      ),
+      h3("Zusammengeführte Datei"),
+      DTOutput("merged_table")
+    )
+  )
+)
+
+server <- function(input, output, session) {
+  observe({
+    toggleState("sql1", condition = !input$has_headers1)
+    toggleState("sql2", condition = !input$has_headers2)
+  })
+  
+  data1 <- reactive({
+    req(input$file1)
+    if (!grepl("\\.csv$|\\.txt$", input$file1$name, ignore.case = TRUE)) {
+      showNotification("Fehler: Ungültiges Dateiformat für Datei 1.", type = "error")
+      return(NULL)
+    }
+    if (input$has_headers1) {
+      df <- read_csv(input$file1$datapath, show_col_types = FALSE)
+    } else {
+      req(input$sql1)
+      col_names <- extract_column_names(input$sql1$datapath)
+      if (is.null(col_names)) return(NULL)
+      df <- read_csv(input$file1$datapath, col_names = col_names, skip = 0, show_col_types = FALSE)
+    }
+    rename_columns(df, input$file1$name)
+  })
+  
+  data2 <- reactive({
+    req(input$file2)
+    if (!grepl("\\.csv$|\\.txt$", input$file2$name, ignore.case = TRUE)) {
+      showNotification("Fehler: Ungültiges Dateiformat für Datei 2.", type = "error")
+      return(NULL)
+    }
+    if (input$has_headers2) {
+      df <- read_csv(input$file2$datapath, show_col_types = FALSE)
+    } else {
+      req(input$sql2)
+      col_names <- extract_column_names(input$sql2$datapath)
+      if (is.null(col_names)) return(NULL)
+      df <- read_csv(input$file2$datapath, col_names = col_names, skip = 0, show_col_types = FALSE)
+    }
+    rename_columns(df, input$file2$name)
+  })
+  
+  output$preview1 <- renderDT({
+    req(data1())
+    datatable(data1(), options = list(scrollX = TRUE))
+  })
+  
+  output$preview2 <- renderDT({
+    req(data2())
+    datatable(data2(), options = list(scrollX = TRUE))
+  })
+  
+  output$select_id1 <- renderUI({
+    req(data1())
+    selectInput("id1", "Wähle ID-Spalte Datei 1:", choices = names(data1()))
+  })
+  
+  output$select_id2 <- renderUI({
+    req(data2())
+    selectInput("id2", "Wähle ID-Spalte Datei 2:", choices = names(data2()))
+  })
+  
+  merged_data <- reactiveVal()
+  
+  observeEvent(input$merge, {
+    req(input$id1, input$id2)
+    
+    join_type <- input$join_type
+    
+    merged <- switch(join_type,
+                     "inner" = merge(data1(), data2(), by.x = input$id1, by.y = input$id2),
+                     "outer" = merge(data1(), data2(), by.x = input$id1, by.y = input$id2, all = TRUE),
+                     "left" = merge(data1(), data2(), by.x = input$id1, by.y = input$id2, all.x = TRUE),
+                     "right" = merge(data1(), data2(), by.x = input$id1, by.y = input$id2, all.y = TRUE))
+    
+    merged_data(merged)
+  })
+  
+  output$merged_table <- renderDT({
+    req(merged_data())
+    datatable(merged_data(), options = list(scrollX = TRUE))
+  })
+  
+  output$download <- downloadHandler(
+    filename = function() {
+      if (input$filename != "") {
+        paste0(input$filename, ".csv")
+      } else {
+        paste0(tools::file_path_sans_ext(input$file1$name), "_", 
+               tools::file_path_sans_ext(input$file2$name), ".csv")
+      }
+    },
+    content = function(file) {
+      req(merged_data())
+      write_csv(merged_data(), file)
+    }
+  )
+  
+  output$download_excel <- downloadHandler(
+    filename = function() {
+      if (input$filename != "") {
+        paste0(input$filename, ".xlsx")
+      } else {
+        paste0(tools::file_path_sans_ext(input$file1$name), "_", 
+               tools::file_path_sans_ext(input$file2$name), ".xlsx")
+      }
+    },
+    content = function(file) {
+      req(merged_data())
+      write_xlsx(merged_data(), file)
+    }
+  )
+ }
+
+shinyApp(ui, server)
diff --git a/www/Logo_DIZ_DE.jpg b/www/Logo_DIZ_DE.jpg
diff --git a/www/readme.html b/www/readme.html
@@ -0,0 +1,76 @@
+<!DOCTYPE html>
+<html lang="de">
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1.0">
+    <title>CSV/SQL Merger - Dokumentation</title>
+    <style>
+        body { font-family: Arial, sans-serif; line-height: 1.6; margin: 40px; }
+        h1, h2, h3 { color: #333; }
+        pre { background: #f4f4f4; padding: 10px; border-radius: 5px; }
+        code { font-weight: bold; }
+        a { color: #007bff; text-decoration: none; }
+        a:hover { text-decoration: underline; }
+    </style>
+</head>
+<body>
+    <h1>CSV/SQL Merger - Dokumentation</h1>
+    <h2>Überblick</h2>
+    <p>Diese Shiny-App ermöglicht das <strong>Hochladen, Verknüpfen und Speichern</strong> von CSV- oder TXT-Dateien mit zugehörigen SQL-Dump-Dateien. Sie wurde entwickelt, um <strong>alte JAM-Py-Datenbankexporte</strong> zu verarbeiten und daraus verknüpfte Tabellen zu erstellen, die als Importdateien für <strong>eLabFTW-Ressourcen</strong> genutzt werden können.</p>
+    
+    <h2>Funktionen</h2>
+    <ul>
+        <li><strong>Import von CSV- oder TXT-Dateien</strong></li>
+        <li><strong>Optionaler Import von SQL-Dump-Dateien</strong>, um Spaltennamen zu extrahieren</li>
+        <li><strong>ID-basierte Verknüpfung</strong> von Tabellen</li>
+        <li><strong>Unterstützung verschiedener Join-Typen</strong> (Inner, Outer, Left, Right)</li>
+        <li><strong>Interaktive Vorschau der Daten</strong></li>
+        <li><strong>Export der verknüpften Tabelle als CSV</strong> mit wählbarem Dateinamen</li>
+    </ul>
+
+    <h2>Nutzungsszenario</h2>
+    <ol>
+        <li><strong>Export aus JAM-Py</strong>: Besteht aus TXT-Dateien mit Rohdaten und einer SQL-Dump-Datei mit Tabellenstrukturen.</li>
+        <li><strong>Datenverknüpfung in Shiny</strong>: Die Shiny-App liest die Dateien ein, verknüpft Tabellen über gemeinsame IDs und erstellt eine bereinigte Datentabelle.</li>
+        <li><strong>Weiterverarbeitung für eLabFTW</strong>: Die resultierende Datei kann mit einer weiteren Shiny-App in das eLabFTW-Format überführt werden.</li>
+    </ol>
+
+    <h2>Installation & Nutzung</h2>
+    <h3>Voraussetzungen</h3>
+    <p>R (>= 4.0) und folgende R-Pakete müssen installiert sein:</p>
+    <pre><code>install.packages(c("shiny", "readr", "writexl", "stringr", "DT", "shinyjs"))</code></pre>
+    
+    <h3>Start der Anwendung</h3>
+    <ol>
+        <li>Repository clonen oder Dateien herunterladen</li>
+        <li>R oder RStudio öffnen</li>
+        <li>Mit folgendem Befehl die App starten:</li>
+    </ol>
+    <pre><code>runApp("Pfad/zur/ShinyApp")</code></pre>
+    
+    <h3>Bedienung der App</h3>
+    <ol>
+        <li><strong>Dateien hochladen</strong>: Wähle zwei CSV/TXT-Dateien aus. Falls die Spaltennamen nicht enthalten sind, kann eine zugehörige SQL-Datei hochgeladen werden.</li>
+        <li><strong>IDs für den Merge auswählen</strong>: Wähle die Spalten, über die die Tabellen verknüpft werden sollen.</li>
+        <li><strong>Join-Typ wählen</strong>: Entscheide, ob ein Inner-, Outer-, Left- oder Right-Join verwendet werden soll.</li>
+        <li><strong>Merge starten</strong>: Die Tabellen werden verknüpft und als interaktive Tabelle dargestellt.</li>
+        <li><strong>Ergebnis speichern</strong>: Die zusammengeführte Tabelle kann mit einem individuell wählbaren Namen als CSV gespeichert werden.</li>
+    </ol>
+    
+    <h2>Technische Details</h2>
+    <ul>
+        <li><strong>SQL-Dump-Datei-Handling</strong>: Die App extrahiert Spaltennamen aus <code>CREATE TABLE</code>-Statements der SQL-Datei.</li>
+        <li><strong>Dynamische Join-Verarbeitung</strong>: Merge-Operationen werden über <code>switch()</code> dynamisch gesteuert.</li>
+        <li><strong>Interaktive Tabellenanzeige</strong>: <code>DT</code> sorgt für eine scrollbare, durchsuchbare Darstellung der Daten.</li>
+        <li><strong>Benutzerfreundliche UI</strong>: <code>shinyjs</code> ermöglicht das Deaktivieren und Aktivieren von UI-Elementen basierend auf Benutzerauswahl.</li>
+    </ul>
+    
+    <h2>Kontakt</h2>
+    <p>Für Fragen oder Verbesserungsvorschläge:</p>
+    <p><strong>Christian Jaeger</strong><br>
+       E-Mail: <a href="mailto:christian.jaeger@uk-halle.de">christian.jaeger@uk-halle.de</a></p>
+    
+    <hr>
+    <p><em>Letzte Aktualisierung: 12. März 2025</em></p>
+</body>
+</html>