LORENE
FFTW3/cftcosi.C
1 /*
2  * Copyright (c) 1999-2002 Eric Gourgoulhon
3  *
4  * This file is part of LORENE.
5  *
6  * LORENE is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License as published by
8  * the Free Software Foundation; either version 2 of the License, or
9  * (at your option) any later version.
10  *
11  * LORENE is distributed in the hope that it will be useful,
12  * but WITHOUT ANY WARRANTY; without even the implied warranty of
13  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
14  * GNU General Public License for more details.
15  *
16  * You should have received a copy of the GNU General Public License
17  * along with LORENE; if not, write to the Free Software
18  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
19  *
20  */
21 
22 
23 
24 
25 /*
26  * Transformation en cos((2*l+1)*theta) sur le deuxieme indice (theta)
27  * d'un tableau 3-D representant une fonction antisymetrique par rapport
28  * au plan z=0.
29  * Utilise la bibliotheque fftw.
30  *
31  * Entree:
32  * -------
33  * int* deg : tableau du nombre effectif de degres de liberte dans chacune
34  * des 3 dimensions: le nombre de points de collocation
35  * en theta est nt = deg[1] et doit etre de la forme
36  * nt = 2*p + 1
37  * int* dimf : tableau du nombre d'elements de ff dans chacune des trois
38  * dimensions.
39  * On doit avoir dimf[1] >= deg[1] = nt.
40  * NB: pour dimf[0] = 1 (un seul point en phi), la transformation
41  * est bien effectuee.
42  * pour dimf[0] > 1 (plus d'un point en phi), la
43  * transformation n'est effectuee que pour les indices (en phi)
44  * j != 1 et j != dimf[0]-1 (cf. commentaires sur borne_phi).
45  *
46  * double* ff : tableau des valeurs de la fonction aux nt points de
47  * de collocation
48  *
49  * theta_l = pi/2 l/(nt-1) 0 <= l <= nt-1
50  *
51  * L'espace memoire correspondant a ce
52  * pointeur doit etre dimf[0]*dimf[1]*dimf[2] et doit
53  * etre alloue avant l'appel a la routine.
54  * Les valeurs de la fonction doivent etre stokees
55  * dans le tableau ff comme suit
56  * f( theta_l ) = ff[ dimf[1]*dimf[2] * j + k + dimf[2] * l ]
57  * ou j et k sont les indices correspondant a
58  * phi et r respectivement.
59  *
60  * int* dimc : tableau du nombre d'elements de cc dans chacune des trois
61  * dimensions.
62  * On doit avoir dimc[1] >= deg[1] = nt.
63  * Sortie:
64  * -------
65  * double* cf : tableau des coefficients c_l de la fonction definis
66  * comme suit (a r et phi fixes)
67  *
68  * f(theta) = som_{l=0}^{nt-2} c_l cos( (2 l+1) theta ) .
69  *
70  * L'espace memoire correspondant a ce
71  * pointeur doit etre dimc[0]*dimc[1]*dimc[2] et doit
72  * etre alloue avant l'appel a la routine.
73  * Le coefficient c_l (0 <= l <= nt-1) est stoke dans
74  * le tableau cf comme suit
75  * c_l = cf[ dimc[1]*dimc[2] * j + k + dimc[2] * l ]
76  * ou j et k sont les indices correspondant a
77  * phi et r respectivement. On a c_{nt-1}=0.
78  *
79  * NB: Si le pointeur ff est egal a cf, la routine ne travaille que sur un
80  * seul tableau, qui constitue une entree/sortie.
81  *
82  */
83 
84 /*
85  * $Id: cftcosi.C,v 1.4 2016/12/05 16:18:05 j_novak Exp $
86  * $Log: cftcosi.C,v $
87  * Revision 1.4 2016/12/05 16:18:05 j_novak
88  * Suppression of some global variables (file names, loch, ...) to prevent redefinitions
89  *
90  * Revision 1.3 2014/10/13 08:53:19 j_novak
91  * Lorene classes and functions now belong to the namespace Lorene.
92  *
93  * Revision 1.2 2014/10/06 15:18:48 j_novak
94  * Modified #include directives to use c++ syntax.
95  *
96  * Revision 1.1 2004/12/21 17:06:02 j_novak
97  * Added all files for using fftw3.
98  *
99  * Revision 1.4 2003/01/31 10:31:23 e_gourgoulhon
100  * Suppressed the directive #include <malloc.h> for malloc is defined
101  * in <stdlib.h>
102  *
103  * Revision 1.3 2002/10/16 14:36:44 j_novak
104  * Reorganization of #include instructions of standard C++, in order to
105  * use experimental version 3 of gcc.
106  *
107  * Revision 1.2 2002/09/09 13:00:39 e_gourgoulhon
108  * Modification of declaration of Fortran 77 prototypes for
109  * a better portability (in particular on IBM AIX systems):
110  * All Fortran subroutine names are now written F77_* and are
111  * defined in the new file C++/Include/proto_f77.h.
112  *
113  * Revision 1.1.1.1 2001/11/20 15:19:29 e_gourgoulhon
114  * LORENE
115  *
116  * Revision 2.0 1999/02/22 15:47:57 hyc
117  * *** empty log message ***
118  *
119  *
120  * $Header: /cvsroot/Lorene/C++/Source/Non_class_members/Coef/FFTW3/cftcosi.C,v 1.4 2016/12/05 16:18:05 j_novak Exp $
121  *
122  */
123 
124 
125 // headers du C
126 #include <cstdlib>
127 #include <fftw3.h>
128 
129 //Lorene prototypes
130 #include "tbl.h"
131 
132 // Prototypage des sous-routines utilisees:
133 namespace Lorene {
134 fftw_plan prepare_fft(int, Tbl*&) ;
135 double* cheb_ini(const int) ;
136 double* chebimp_ini(const int ) ;
137 //*****************************************************************************
138 
139 void cftcosi(const int* deg, const int* dimf, double* ff, const int* dimc,
140  double* cf)
141 {
142 
143 int i, j, k ;
144 
145 // Dimensions des tableaux ff et cf :
146  int n1f = dimf[0] ;
147  int n2f = dimf[1] ;
148  int n3f = dimf[2] ;
149  int n1c = dimc[0] ;
150  int n2c = dimc[1] ;
151  int n3c = dimc[2] ;
152 
153 // Nombre de degres de liberte en theta :
154  int nt = deg[1] ;
155 
156 // Tests de dimension:
157  if (nt > n2f) {
158  cout << "cftcosi: nt > n2f : nt = " << nt << " , n2f = "
159  << n2f << endl ;
160  abort () ;
161  exit(-1) ;
162  }
163  if (nt > n2c) {
164  cout << "cftcosi: nt > n2c : nt = " << nt << " , n2c = "
165  << n2c << endl ;
166  abort () ;
167  exit(-1) ;
168  }
169  if (n1f > n1c) {
170  cout << "cftcosi: n1f > n1c : n1f = " << n1f << " , n1c = "
171  << n1c << endl ;
172  abort () ;
173  exit(-1) ;
174  }
175  if (n3f > n3c) {
176  cout << "cftcosi: n3f > n3c : n3f = " << n3f << " , n3c = "
177  << n3c << endl ;
178  abort () ;
179  exit(-1) ;
180  }
181 
182 // Nombre de points pour la FFT:
183  int nm1 = nt - 1;
184  int nm1s2 = nm1 / 2;
185 
186 // Recherche des tables pour la FFT:
187  Tbl* pg = 0x0 ;
188  fftw_plan p = prepare_fft(nm1, pg) ;
189  Tbl& g = *pg ;
190 
191 // Recherche de la table des sin(psi) :
192  double* sinp = cheb_ini(nt);
193 
194 // Recherche de la table des points de collocations x_k :
195  double* x = chebimp_ini(nt);
196 
197 // boucle sur phi et r (les boucles vont resp. de 0 a max(dimf[0]-2,0) et
198 // 0 a dimf[2]-1 )
199 
200  int n2n3f = n2f * n3f ;
201  int n2n3c = n2c * n3c ;
202 
203 /*
204  * Borne de la boucle sur phi:
205  * si n1f = 1, on effectue la boucle une fois seulement.
206  * si n1f > 1, on va jusqu'a j = n1f-2 en sautant j = 1 (les coefficients
207  * j=n1f-1 et j=0 ne sont pas consideres car nuls).
208  */
209  int borne_phi = ( n1f > 1 ) ? n1f-1 : 1 ;
210 
211  for (j=0; j< borne_phi; j++) {
212 
213  if (j==1) continue ; // on ne traite pas le terme en sin(0 phi)
214 
215  for (k=0; k<n3f; k++) {
216 
217  int i0 = n2n3f * j + k ; // indice de depart
218  double* ff0 = ff + i0 ; // tableau des donnees a transformer
219 
220  i0 = n2n3c * j + k ; // indice de depart
221  double* cf0 = cf + i0 ; // tableau resultat
222 
223 // Multiplication de la fonction par x=cos(theta) (pour la rendre paire)
224 // NB: dans les commentaires qui suivent, on note h(x) = x f(x).
225 // (Les valeurs de h dans l'espace des configurations sont stokees dans le
226 // tableau cf0).
227  for (i=0; i<nt-1; i++) cf0[n3c*i] = x[nm1-i] * ff0[n3f*i] ;
228  cf0[n3c*nm1] = 0 ;
229 
230 /*
231  * NB: dans les commentaires qui suivent, psi designe la variable de [0, pi]
232  * reliee a theta par psi = 2 theta et F(psi) = f(theta(psi)).
233  */
234 
235 // Valeur en psi=0 de la partie antisymetrique de F, F_ :
236  double fmoins0 = 0.5 * ( cf0[0] - cf0[ n3c*nm1 ] );
237 
238 // Fonction G(psi) = F+(psi) + F_(psi) sin(psi)
239 //---------------------------------------------
240  for ( i = 1; i < nm1s2 ; i++ ) {
241 // ... indice (dans le tableau g) du pt symetrique de psi par rapport a pi/2:
242  int isym = nm1 - i ;
243 // ... indice (dans le tableau cf0) du point theta correspondant a psi
244  int ix = n3c * i ;
245 // ... indice (dans le tableau cf0) du point theta correspondant a sym(psi)
246  int ixsym = n3c * isym ;
247 // ... F+(psi)
248  double fp = 0.5 * ( cf0[ix] + cf0[ixsym] ) ;
249 // ... F_(psi) sin(psi)
250  double fms = 0.5 * ( cf0[ix] - cf0[ixsym] ) * sinp[i] ;
251  g.set(i) = fp + fms ;
252  g.set(isym) = fp - fms ;
253  }
254 //... cas particuliers:
255  g.set(0) = 0.5 * ( cf0[0] + cf0[ n3c*nm1 ] );
256  g.set(nm1s2) = cf0[ n3c*nm1s2 ];
257 
258 // Developpement de G en series de Fourier par une FFT
259 //----------------------------------------------------
260 
261  fftw_execute(p) ;
262 
263 // Coefficients pairs du developmt. de Tchebyshev de h
264 //----------------------------------------------------
265 // Ces coefficients sont egaux aux coefficients en cosinus du developpement
266 // de G en series de Fourier (le facteur 2/nm1 vient de la normalisation
267 // de fftw; si fftw donnait reellement les coef. en cosinus, il faudrait le
268 // remplacer par un +1.) :
269 
270  double fac = 2./double(nm1) ;
271  cf0[0] = g(0) / double(nm1) ;
272  for (i=2; i<nm1; i += 2 ) cf0[n3c*i] = fac * g(i/2) ;
273  cf0[n3c*nm1] = g(nm1s2) ;
274 
275 // Coefficients impairs du developmt. de Tchebyshev de h
276 //------------------------------------------------------
277 // 1. Coef. c'_k (recurrence amorcee a partir de zero)
278 // Le 4/nm1 en facteur de g(i) est du a la normalisation de fftw
279 // (si fftw donnait reellement les coef. en sinus, il faudrait le
280 // remplacer par un -2.)
281  fac *= 2. ;
282  cf0[n3c] = 0 ;
283  double som = 0;
284  for ( i = 3; i < nt; i += 2 ) {
285  cf0[n3c*i] = cf0[n3c*(i-2)] + fac * g(nm1 - i/2) ;
286  som += cf0[n3c*i] ;
287  }
288 
289 // 2. Calcul de c_1 :
290  double c1 = ( fmoins0 - som ) / nm1s2 ;
291 
292 // 3. Coef. c_k avec k impair:
293  cf0[n3c] = c1 ;
294  for ( i = 3; i < nt; i += 2 ) cf0[n3c*i] += c1 ;
295 
296 
297 // Coefficients de f en fonction de ceux de h
298 //-------------------------------------------
299 
300  cf0[0] = 2* cf0[0] ;
301  for (i=1; i<nm1; i++) {
302  cf0[n3c*i] = 2 * cf0[n3c*i] - cf0[n3c*(i-1)] ;
303  }
304  cf0[n3c*nm1] = 0 ;
305 
306  } // fin de la boucle sur r
307  } // fin de la boucle sur phi
308 
309 }
310 }
Lorene prototypes.
Definition: app_hor.h:67