merged action of parallel_tridiag

Gaspare99 · Gaspare99 · commit 23a26ffc61f6 · 2025-06-25T22:16:55.000+02:00
diff --git a/src/pyclassify/parallel_tridiag_eigen.py b/src/pyclassify/parallel_tridiag_eigen.py
@@ -1,7 +1,11 @@
 from mpi4py import MPI
 import numpy as np
 from time import time
-from pyclassify.cxx_utils import QR_algorithm, secular_solver_cxx, deflate_eigenpairs_cxx
+from pyclassify.cxx_utils import (
+    QR_algorithm,
+    secular_solver_cxx,
+    deflate_eigenpairs_cxx,
+)
 from pyclassify.zero_finder import secular_solver_python as secular_solver
 from line_profiler import profile, LineProfiler
 import scipy.sparse as sp
@@ -158,19 +162,22 @@ def deflate_eigenpairs(D, v, beta, tol_factor=1e-12):
 
     return deflated_eigvals, np.array(deflated_eigvecs), D_keep, v_keep, P_3 @ P_2 @ P
 
+
 def find_interval_extreme(total_dimension, n_processor):
     """
     Computes the intervals for vector for being scattered.
         Input:
             -total_dimension: the dimension of the vector that has to be splitted
             -n_processor:     the number of processor to which the scatter vector has to be sent
-        
+
     """
 
-    base= total_dimension // n_processor
+    base = total_dimension // n_processor
     rest = total_dimension % n_processor
 
-    counts = np.array([base + 1 if i < rest else base for i in range(n_processor)], dtype=int)
+    counts = np.array(
+        [base + 1 if i < rest else base for i in range(n_processor)], dtype=int
+    )
     displs = np.insert(np.cumsum(counts), 0, 0)[:-1]
 
     return counts, displs
@@ -210,7 +217,6 @@ def parallel_tridiag_eigen(
     n = len(diag)
     prof_filename = f"Profile_folder/profile.rank{current_rank}.depth{depth}.lprof"
 
-
     if n <= min_size or size == 1:
         eigvals, eigvecs = QR_algorithm(diag, off, 1e-16, max_iterQR)
         eigvecs = np.array(eigvecs)
@@ -245,8 +251,8 @@ def parallel_tridiag_eigen(
             depth=depth + 1,
             profiler=profiler,
         )
-        eigvals_right=None
-        eigvecs_right=None
+        eigvals_right = None
+        eigvecs_right = None
     else:
         eigvals_right, eigvecs_right = parallel_tridiag_eigen(
             diag2,
@@ -257,50 +263,49 @@ def parallel_tridiag_eigen(
             depth=depth + 1,
             profiler=profiler,
         )
-        eigvals_left=None
-        eigvecs_left=None
-
+        eigvals_left = None
+        eigvecs_left = None
 
     # 1) Identify the two “root” ranks in MPI.COMM_WORLD
-    left_size  = size // 2 if size>1 else 1
-    root_left  = 0
+    left_size = size // 2 if size > 1 else 1
+    root_left = 0
     root_right = left_size
-    other_root = root_right if color==0 else root_left
+    other_root = root_right if color == 0 else root_left
 
-        # now exchange between the two roots
+    # now exchange between the two roots
     if subcomm.Get_rank() == 0:
-        send_data = (eigvals_left, eigvecs_left) \
-                    if color == 0 else (eigvals_right, eigvecs_right)
+        send_data = (
+            (eigvals_left, eigvecs_left)
+            if color == 0
+            else (eigvals_right, eigvecs_right)
+        )
         recv_data = comm.sendrecv(
-            send_data, dest=other_root, sendtag=depth,
-            source=other_root, recvtag=depth
+            send_data, dest=other_root, sendtag=depth, source=other_root, recvtag=depth
         )
         # unpack
         if color == 0:
             eigvals_right, eigvecs_right = recv_data
         else:
-            eigvals_left,  eigvecs_left  = recv_data
+            eigvals_left, eigvecs_left = recv_data
 
-    eigvals_left  = subcomm.bcast(eigvals_left,  root=0)
-    eigvecs_left  = subcomm.bcast(eigvecs_left,  root=0)
+    eigvals_left = subcomm.bcast(eigvals_left, root=0)
+    eigvecs_left = subcomm.bcast(eigvecs_left, root=0)
     eigvals_right = subcomm.bcast(eigvals_right, root=0)
     eigvecs_right = subcomm.bcast(eigvecs_right, root=0)
 
-
     # if rank == 0:
     #     eigvals_right = comm.recv(source=left_size, tag=77)
     #     eigvecs_right = comm.recv(source=left_size, tag=78)
     # elif rank == left_size:
     #     comm.send(eigvals_right, dest=0, tag=77)
     #     comm.send(eigvecs_right, dest=0, tag=78)
-    
 
     if rank == 0:
 
         # Merge Step
         n1 = len(eigvals_left)
         D = np.concatenate((eigvals_left, eigvals_right))
-        D_size=D.size
+        D_size = D.size
         v_vec = np.concatenate((eigvecs_left[-1, :], eigvecs_right[0, :]))
 
         deflated_eigvals, deflated_eigvecs, D_keep, v_keep, P = deflate_eigenpairs_cxx(
@@ -329,37 +334,37 @@ def parallel_tridiag_eigen(
                 beta, D_keep[idx], v_keep[idx] , np.arange(reduced_dim)
             )
             lam = np.array(lam)
-            delta=np.array(delta)
-            changing_position=np.array(changing_position)
-
+            delta = np.array(delta)
+            changing_position = np.array(changing_position)
+            # #diff=lam_s-lam
         else:
             lam = np.array([])
-        
+
         counts, displs = find_interval_extreme(reduced_dim, size)
 
     else:
         counts = None
         displs = None
-        lam=None
-        D_keep=None
-        v_keep=None
-        delta=None
-        reduced_dim=None
-        D_size=None
-        changing_position=None
-        type_lam=None
-        type_D= None
-        P=None
-        idx_inv=None
-        n1=None
+        lam = None
+        D_keep = None
+        v_keep = None
+        delta = None
+        reduced_dim = None
+        D_size = None
+        changing_position = None
+        type_lam = None
+        type_D = None
+        P = None
+        idx_inv = None
+        n1 = None
         deflated_eigvals = None
         deflated_eigvecs = None
-    
+
     counts = comm.bcast(counts, root=0)
     displs = comm.bcast(displs, root=0)
-    lam=comm.bcast(lam, root=0)
-    D_keep=comm.bcast(D_keep, root=0)
-    v_keep=comm.bcast(v_keep, root=0)
+    lam = comm.bcast(lam, root=0)
+    D_keep = comm.bcast(D_keep, root=0)
+    v_keep = comm.bcast(v_keep, root=0)
     my_count = counts[rank]
     type_lam=comm.bcast(lam.dtype, root=0)
 
@@ -389,28 +394,30 @@ def parallel_tridiag_eigen(
     # now do the scatterv
     comm.Scatterv(
         [lam, counts, displs, mpi_type],  # send tuple, only root’s lam is used here
-        lam_buffer,                        # recvbuf on every rank
-        root=0
+        lam_buffer,  # recvbuf on every rank
+        root=0,
     )
 
 
-    initial_point=displs[rank]
+    initial_point = displs[rank]
 
     for k_rel in range(lam_buffer.size):
-        k=k_rel+initial_point
+        k = k_rel + initial_point
         numerator = lam - D_keep[k]
         denominator = np.concatenate((D_keep[:k], D_keep[k + 1 :])) - D_keep[k]
         numerator[:-1] = numerator[:-1] / denominator
         v_keep[k] = np.sqrt(np.abs(np.prod(numerator) / beta)) * np.sign(v_keep[k])
 
     # eigenpairs = []
 
-    eig_vecs=np.empty((D_size, my_count),dtype=type_lam )
-    eig_val=np.empty(my_count, dtype=type_lam )
+    eig_vecs = np.empty((D_size, my_count), dtype=type_lam)
+    eig_val = np.empty(my_count, dtype=type_lam)
 
     for j_rel in range(lam_buffer.size):
         y = np.zeros(D_size)
-        j=j_rel + initial_point
+        # y[:reduced_dim]=v_keep/(lam[j]-D_keep)
+        # y /= np.linalg.norm(y)
+        j = j_rel + initial_point
         diff = lam[j] - D_keep
         diff[idx_inv[changing_position[j]]] = delta[j]
         y[:reduced_dim] = v_keep / (diff)
@@ -421,75 +428,72 @@ def parallel_tridiag_eigen(
         y = P.T @ y
         vec = np.concatenate((eigvecs_left @ y[:n1], eigvecs_right @ y[n1:]))
         vec /= np.linalg.norm(vec)
-        eig_vecs[:, j_rel]=vec
-        eig_val[j_rel]=lam[j]
-        #eigenpairs.append((lam[j], vec))
+        eig_vecs[:, j_rel] = vec
+        eig_val[j_rel] = lam[j]
+        # eigenpairs.append((lam[j], vec))
 
-    if reduced_dim<D_size:
+    if reduced_dim < D_size:
 
-        if rank==0:
-            le_deflation=len(deflated_eigvals)
+        if rank == 0:
+            le_deflation = len(deflated_eigvals)
             counts, displs = find_interval_extreme(le_deflation, size)
 
         counts = comm.bcast(counts, root=0)
         displs = comm.bcast(displs, root=0)
         my_count = counts[rank]
-        
-        deflated_eigvals_buffer=np.empty(my_count, dtype=type_lam)
+
+        deflated_eigvals_buffer = np.empty(my_count, dtype=type_lam)
         if rank == 0:
             char = deflated_eigvals.dtype.char
-            type_eig=deflated_eigvals.dtype
+            type_eig = deflated_eigvals.dtype
         else:
             char = None
-            type_eig= None
+            type_eig = None
 
         # now everyone learns the character code:
         char = comm.bcast(char, root=0)
         type_eig = comm.bcast(type_eig, root=0)
         comm.Scatterv(
-        [deflated_eigvals, counts, displs, MPI._typedict[char]],
-        deflated_eigvals_buffer,
-        root=0,
+            [deflated_eigvals, counts, displs, MPI._typedict[char]],
+            deflated_eigvals_buffer,
+            root=0,
         )
-        if rank==0:
-            _, k=deflated_eigvecs.shape
+        if rank == 0:
+            _, k = deflated_eigvecs.shape
         else:
             mat = None
-            k=None
-        k=comm.bcast(k, root=0)
+            k = None
+        k = comm.bcast(k, root=0)
         # each row of `mat` is one deflated vec
         sendcounts = [c * k for c in counts]
-        senddispls  = [d * k for d in displs]
-        deflated_eigvecs_buffer = np.empty( (my_count, k), dtype=type_eig)
+        senddispls = [d * k for d in displs]
+        deflated_eigvecs_buffer = np.empty((my_count, k), dtype=type_eig)
         if rank == 0:
-            flat_send = deflated_eigvecs.copy().flatten()        # shape (M*k,)
+            flat_send = deflated_eigvecs.copy().flatten()  # shape (M*k,)
             sendbuf = [flat_send, sendcounts, senddispls, MPI._typedict[char]]
         else:
             sendbuf = None
-            
 
         # now scatter to everyone
         comm.Scatterv(
-            sendbuf,                    # only meaningful on rank 0
-            deflated_eigvecs_buffer,    # each rank’s recv‐buffer of length k × my_count
-            root=0
+            sendbuf,  # only meaningful on rank 0
+            deflated_eigvecs_buffer,  # each rank’s recv‐buffer of length k × my_count
+            root=0,
         )
-        
 
-        #local_final_vecs = np.empty((k, my_count), dtype=deflated_eigvecs.dtype)
+        # local_final_vecs = np.empty((k, my_count), dtype=deflated_eigvecs.dtype)
         for i in range(my_count):
             small_vec = deflated_eigvecs_buffer[i]
             # apply the two block Q’s:
-            left_part  = eigvecs_left @ small_vec[:n1]
+            left_part = eigvecs_left @ small_vec[:n1]
             right_part = eigvecs_right @ small_vec[n1:]
             local_final_vecs = np.concatenate((left_part, right_part))
             local_final_vecs = local_final_vecs.reshape(k, 1)
-            eig_val=np.append(eig_val, deflated_eigvals_buffer[i])
-            eig_vecs=np.concatenate([eig_vecs, local_final_vecs], axis=1)
+            eig_val = np.append(eig_val, deflated_eigvals_buffer[i])
+            eig_vecs = np.concatenate([eig_vecs, local_final_vecs], axis=1)
 
-    
     # 1) Each rank computes its local length:
-    local_count = eig_val.size   # or however many elements you’ll send
+    local_count = eig_val.size  # or however many elements you’ll send
 
     # 2) Everyone exchanges counts via allgather:
     #    this returns a Python list of length `size` on every rank
@@ -500,48 +504,39 @@ def parallel_tridiag_eigen(
 
     # # 2) Broadcast that list from rank 0 back to everyone
     # recvcounts = comm.bcast(counts, root=0)
-            
 
     final_eig_val = np.empty(D_size, dtype=eig_val.dtype)
 
-
-    
-    displs=np.append([0], np.cumulative_sum(recvcounts[:-1]).astype(int))
+    displs = np.append([0], np.cumulative_sum(recvcounts[:-1]).astype(int))
 
     mpi_t = MPI._typedict[eig_val.dtype.char]
-    comm.Allgatherv(
-    [eig_val,        mpi_t],
-    [final_eig_val, recvcounts, displs, mpi_t]
-)
-    
+    comm.Allgatherv([eig_val, mpi_t], [final_eig_val, recvcounts, displs, mpi_t])
+
     # 1) Flatten local eigenvector block
-#    eig_vecs has shape (D_size, local_count)
-    local_flat = eig_vecs.T.flatten()  
+    #    eig_vecs has shape (D_size, local_count)
+    local_flat = eig_vecs.T.flatten()
 
     # 2) Build sendcounts & displacements for the flattened arrays
     sendcounts_vecs = [c * D_size for c in recvcounts]
-    senddispls_vecs  = [d * D_size for d in displs]
+    senddispls_vecs = [d * D_size for d in displs]
 
     # 3) Allocate full receive buffer on every rank
     flat_all = np.empty(sum(sendcounts_vecs), dtype=eig_vecs.dtype)
 
     # 4) Perform the all-gather-variable-counts
     mpi_tvec = MPI._typedict[eig_vecs.dtype.char]
     comm.Allgatherv(
-        [local_flat,         mpi_tvec],                # sendbuf
-        [flat_all,
-        sendcounts_vecs,
-        senddispls_vecs,
-        mpi_tvec]                                      # recvbuf spec
+        [local_flat, mpi_tvec],  # sendbuf
+        [flat_all, sendcounts_vecs, senddispls_vecs, mpi_tvec],  # recvbuf spec
     )
 
     # 5) Reshape on every rank (or just on rank 0 if you prefer)
     #    total_pairs == sum(recvcounts)
     final_eig_vecs = flat_all.reshape(D_size, D_size)
-    final_eig_vecs=final_eig_vecs.T
-    index_sort=np.argsort(final_eig_val)
-    final_eig_vecs=final_eig_vecs[:, index_sort]
-    final_eig_val=final_eig_val[index_sort]
+    final_eig_vecs = final_eig_vecs.T
+    index_sort = np.argsort(final_eig_val)
+    final_eig_vecs = final_eig_vecs[:, index_sort]
+    final_eig_val = final_eig_val[index_sort]
     # if rank==0:
     #     print(final_eig_val)
     #     print(final_eig_vecs)