Update memory profiling

lorenzotomada · lorenzotomada · commit d147cd033a4b · 2025-06-29T15:34:26.000+02:00
diff --git a/scripts/profiling_memory.py b/scripts/profiling_memory.py
@@ -6,186 +6,193 @@
     profile_scipy_eigvals,
     poisson_2d_structure,
 )
+from pyclassify.parallel_tridiag_eigen import parallel_tridiag_eigen
+
 import numpy as np
 import scipy
 import argparse
-from mpi4py import MPI
-import scipy
 import scipy.sparse as sp
 import psutil
 import gc
 import os
 import csv
 import sys
-
-sys.path.append("scripts")
-# from mpi_running import compute_eigvals
+from mpi4py import MPI
 
 
-# Seed for reproducibility
 seed = 8422
 np.random.seed(seed)
 
 
-parser = argparse.ArgumentParser()
-parser.add_argument("--config", type=str, required=False, help="config file:")
-args = parser.parse_args()
-config_file = args.config if args.config else "experiments/config"
+comm = MPI.COMM_WORLD
+rank = comm.Get_rank()
+size = comm.Get_size()
+
 
-kwargs = read_config(config_file)
+if rank == 0:
+    # parse arguments
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--config", type=str, required=False, help="config file:")
+    args = parser.parse_args()
+    config_file = args.config if args.config else "experiments/config"
+    kwargs = read_config(config_file)
+    dim = kwargs["dim"]
+    density = kwargs["density"]
+    n_procs = kwargs["n_processes"]
+    plot = kwargs["plot"]
+else:
+    kwargs = None
+
+# Broadcast config to all ranks
+kwargs = comm.bcast(kwargs, root=0)
 dim = kwargs["dim"]
 density = kwargs["density"]
 n_procs = kwargs["n_processes"]
 plot = kwargs["plot"]
 
+# Now we build the matrix on rank 0
+# It is a scipy sparse matrix with the structure of a 2D Poisson problem matrix obtained using finite differences
+if rank == 0:
+    A = poisson_2d_structure(dim)
+    A_np = A.toarray()
+else:
+    A_np = None
 
-def parallel_eig(diag, off_diag, nprocs):
-    print("Spawning a communicator")
-    comm = MPI.COMM_SELF.Spawn(sys.executable, args=["scripts/run.py"], maxprocs=nprocs)
-
-    print("Sending data to children")
-    comm.send(diag, dest=0, tag=11)
-    comm.send(off_diag, dest=0, tag=12)
+A_np = comm.bcast(A_np, root=0)
 
-    print("Waiting for results...")
-    sys.stdout.flush()
 
-    eigvals = comm.recv(source=0, tag=22)
-    eigvecs = comm.recv(source=0, tag=23)
-    delta_t = comm.recv(source=0, tag=24)
-    total_mem_children = comm.recv(source=0, tag=25)
-    comm.Disconnect()
+# On rank 0, we use the Lanczos method
+# We actually call it twice: the first time to ensure that the function is JIT-compiled by Numba, the second one for memory profiling
+if rank == 0:
+    print("Precompiling Lanczos...")
+    Q, diag, off_diag = Lanczos_PRO(A_np, np.ones_like(np.diag(A_np)) * 1.0)
+    print("Done. Now reducing using Lanczos...")
+    gc.collect()
+    proc = psutil.Process()
+    mem_before_lanczos = proc.memory_info().rss / 1024 / 1024  # MB
 
-    print("Data recieved!")
-    return eigvals, eigvecs, delta_t, total_mem_children
+    Q, diag, off_diag = Lanczos_PRO(A_np, np.ones_like(np.diag(A_np)) * 1.0)
 
+    gc.collect()
+    mem_after_lanczos = proc.memory_info().rss / 1024 / 1024  # MB
+    delta_mem_lanczos = mem_after_lanczos - mem_before_lanczos
+    print("Done. Now computing eigenvalues...")
+else:
+    diag = off_diag = None
 
-def compute_eigvals(A, n_procs):
-    print("Reducing using Lanczos")
-    Q, diag, off_diag = Lanczos_PRO(A_np, np.ones_like(np.diag(A_np)) * 1.0)
+diag = comm.bcast(diag, root=0)
+off_diag = comm.bcast(off_diag, root=0)
 
-    print("Done. Now computing eigenvalues.")
-    eigvals, eigvecs, delta_t, total_mem_children = parallel_eig(
-        diag, off_diag, n_procs
-    )
+gc.collect()
+proc = psutil.Process()
+mem_before = proc.memory_info().rss / 1024 / 1024  # MB
 
-    print("Eigenvalues computed")
-    return eigvals, eigvecs, delta_t, total_mem_children
+eigvals, eigvecs = parallel_tridiag_eigen(
+    diag, off_diag, comm=comm, min_size=1, tol_factor=1e-10
+)
 
+gc.collect()
+mem_after = proc.memory_info().rss / 1024 / 1024
+delta_mem = mem_after - mem_before
+
+total_mem_children = comm.reduce(delta_mem, op=MPI.SUM, root=0)
+
+if rank == 0:
+    total_mem_all = delta_mem_lanczos
+    print("Eigenvalues computed.")
+    process = psutil.Process()
+
+    print(f"Total memory across all processes: {total_mem_all:.2f} MB")
+
+    mem_np = profile_numpy_eigvals(A_np)
+    print(f"NumPy eig memory usage: {mem_np:.2f} MB")
+
+    mem_sp = profile_scipy_eigvals(A_np)
+    print(f"SciPy eig memory usage: {mem_sp:.2f} MB")
+
+    os.makedirs("logs", exist_ok=True)
+    log_file = "logs/memory_profile.csv"
+    fieldnames = [
+        "matrix_size",
+        "n_processes",
+        "mem_lanzos_mb",
+        "mem_tridiag_mb",
+        "mem_total_mb",
+        "mem_numpy_mb",
+        "mem_scipy_mb",
+    ]
+
+    write_header = not os.path.exists(log_file)
+    with open(log_file, mode="a", newline="") as f:
+        writer = csv.DictWriter(f, fieldnames=fieldnames)
+        if write_header:
+            writer.writeheader()
+        writer.writerow(
+            {
+                "matrix_size": dim,
+                "n_processes": size,
+                "mem_lanzos_mb": round(delta_mem_lanczos, 2),
+                "mem_tridiag_mb": round(total_mem_children, 2),
+                "mem_total_mb": round(total_mem_all, 2),
+                "mem_numpy_mb": round(mem_np, 2),
+                "mem_scipy_mb": round(mem_sp, 2),
+            }
+        )
 
-A = poisson_2d_structure(dim)
-A_np = A.toarray()
+    if plot:
+        import matplotlib.pyplot as plt
+        import pandas as pd
 
-Q, diag, off_diag = Lanczos_PRO(
-    A_np, np.ones_like(np.diag(A_np)) * 1.0
-)  # To compile using numba
+        df = pd.read_csv("logs/memory_profile.csv")
+        nproc_values = sorted(df["n_processes"].unique())
 
-gc.collect()
-process = psutil.Process()
-mem_before = process.memory_info().rss / 1024 / 1024
+        plt.figure(figsize=(10, 6))
 
-eigvals, eigvecs, delta_t, total_mem_children = compute_eigvals(A_np, n_procs)
+        numpy_avg = df.groupby("matrix_size")["mem_numpy_mb"].mean()
+        plt.plot(
+            numpy_avg.index,
+            numpy_avg.values,
+            color="green",
+            marker="x",
+            linestyle="--",
+            label="NumPy",
+        )
 
-gc.collect()
-mem_after = process.memory_info().rss / 1024 / 1024
-delta_mem_parent = mem_after - mem_before
-
-total_mem_all = delta_mem_parent + total_mem_children
-
-print(f"Total memory across all processes: {total_mem_all:.2f} MB")
-
-mem_np = profile_numpy_eigvals(A_np)
-print(f"NumPy eig memory usage: {mem_np:.2f} MB")
-
-mem_sp = profile_scipy_eigvals(A_np)
-print(f"SciPy eig memory usage: {mem_sp:.2f} MB")
-
-os.makedirs("logs", exist_ok=True)
-
-log_file = "logs/memory_profile.csv"
-fieldnames = [
-    "matrix_size",
-    "n_processes",
-    "mem_parent_mb",
-    "mem_children_mb",
-    "mem_total_mb",
-    "mem_numpy_mb",
-    "mem_scipy_mb",
-]
-
-write_header = not os.path.exists(log_file)
-
-with open(log_file, mode="a", newline="") as f:
-    writer = csv.DictWriter(f, fieldnames=fieldnames)
-    if write_header:
-        writer.writeheader()
-    writer.writerow(
-        {
-            "matrix_size": dim,
-            "n_processes": n_procs,
-            "mem_parent_mb": round(delta_mem_parent, 2),
-            "mem_children_mb": round(total_mem_children, 2),
-            "mem_total_mb": round(total_mem_all, 2),
-            "mem_numpy_mb": round(mem_np, 2),
-            "mem_scipy_mb": round(mem_sp, 2),
-        }
-    )
-
-if plot:
-    import matplotlib.pyplot as plt
-    import pandas as pd
-    import matplotlib.colors as mcolors
-    import numpy as np
-
-    df = pd.read_csv("logs/memory_profile.csv")
-
-    nproc_values = sorted(df["n_processes"].unique())
-
-    plt.figure(figsize=(10, 6))
-
-    numpy_avg = df.groupby("matrix_size")["mem_numpy_mb"].mean()
-    plt.plot(
-        numpy_avg.index,
-        numpy_avg.values,
-        color="green",
-        marker="x",
-        linestyle="--",
-        label="NumPy",
-    )
-
-    scipy_avg = df.groupby("matrix_size")["mem_scipy_mb"].mean()
-    plt.plot(
-        scipy_avg.index,
-        scipy_avg.values,
-        color="red",
-        marker="^",
-        linestyle=":",
-        label="SciPy",
-    )
-
-    for nproc in nproc_values:
-        subset = df[df["n_processes"] == nproc].sort_values("matrix_size")
-        label = f"Divide and Conquer ({nproc} proc{'s' if nproc > 1 else ''})"
+        scipy_avg = df.groupby("matrix_size")["mem_scipy_mb"].mean()
         plt.plot(
-            subset["matrix_size"],
-            subset["mem_total_mb"],
-            marker="o",
-            linestyle="-",
-            label=label,
+            scipy_avg.index,
+            scipy_avg.values,
+            color="red",
+            marker="^",
+            linestyle=":",
+            label="SciPy",
+        )
+
+        for nproc in nproc_values:
+            subset = df[df["n_processes"] == nproc].sort_values("matrix_size")
+            label = f"Divide et impera ({nproc} proc{'s' if nproc > 1 else ''})"
+            plt.plot(
+                subset["matrix_size"],
+                subset["mem_total_mb"],
+                marker="o",
+                linestyle="-",
+                label=label,
+            )
+
+        plt.xlabel("Matrix size")
+        plt.ylabel("Total memory (MB)")
+        plt.xscale("log")
+        plt.title("Memory usage vs. Matrix size")
+        plt.grid(True)
+        plt.tight_layout()
+
+        plt.legend(
+            bbox_to_anchor=(1.05, 1),
+            loc="upper left",
+            borderaxespad=0.0,
+            title="Method",
         )
+        plt.subplots_adjust(right=0.75)
 
-    plt.xlabel("Matrix size")
-    plt.ylabel("Total memory (MB)")
-    plt.xscale("log")
-    # plt.yscale("log")
-    plt.title("Memory usage vs. Matrix size")
-    plt.grid(True)
-    plt.tight_layout()
-
-    plt.legend(
-        bbox_to_anchor=(1.05, 1), loc="upper left", borderaxespad=0.0, title="Method"
-    )
-    plt.subplots_adjust(right=0.75)
-
-    plt.savefig("logs/mem_vs_size_all_methods.png", bbox_inches="tight")
-    plt.show()
+        plt.savefig("logs/mem_vs_size_all_methods.png", bbox_inches="tight")
+        plt.show()
diff --git a/shell/submit.sh b/shell/submit.sh
@@ -1,8 +1,8 @@
 #!/bin/bash
 
 # Ranges over which we iterate
-n_processes=(1 2 4 8)
-matrix_sizes=(10 100 500 1000)
+n_processes=(1 2)
+matrix_sizes=(10 15 20)
 
 last_dim="${matrix_sizes[-1]}"
 last_nproc="${n_processes[-1]}"
@@ -31,11 +31,11 @@ for dim in "${matrix_sizes[@]}"; do
       sed -i "s/^plot: .*/plot: true/" $CONFIG_FILE
     fi
 
-    python scripts/profiling_memory.py
+    mpirun -np ${n_p} python scripts/profiling_memory.py
   done
 done
 
 # Restore the original config file
 mv ${CONFIG_FILE}.bak $CONFIG_FILE
 
-echo "Experiment completed!"
+echo "Experiment completed!"