]> git.deb.at Git - deb/packages.git/blob - bin/create_index_pages
Complete rewrite of create_index_pages
[deb/packages.git] / bin / create_index_pages
1 #!/usr/bin/perl
2
3 use strict;
4 use warnings;
5
6 use POSIX;
7 use File::Path;
8 use DB_File;
9 use Storable;
10 use HTML::Entities;
11 use URI::Escape;
12 use Compress::Zlib;
13
14 use lib './lib';
15
16 use Packages::CommonCode qw(:all);
17 use Packages::Config qw( $TOPDIR $DBDIR @ARCHIVES @SUITES @LANGUAGES );
18 use Packages::Template;
19 use Packages::I18N::Locale;
20 use Packages::Page;
21 use Packages::SrcPage;
22 use Packages::Sections;
23 &Packages::Config::init( './' );
24
25 use constant DEBUG => 0;
26
27 my $wwwdir = "$TOPDIR/www";
28
29 tie my %packages, 'DB_File', "$DBDIR/packages_small.db",
30     O_RDONLY, 0666, $DB_BTREE
31     or die "couldn't tie DB $DBDIR/packages_small.db: $!";
32 tie my %src_packages, 'DB_File', "$DBDIR/sources_small.db",
33     O_RDONLY, 0666, $DB_BTREE
34     or die "couldn't tie DB $DBDIR/sources_small.db: $!";
35 tie my %src2bin, 'DB_File', "$DBDIR/sources_packages.db",
36     O_RDONLY, 0666, $DB_BTREE
37     or die "couldn't open $DBDIR/sources_packages.db: $!";
38 tie my %desctrans, 'DB_File', "$DBDIR/descriptions_translated.db",
39     O_RDONLY, 0666, $DB_BTREE
40     or die "couldn't tie DB $DBDIR/descriptions_translated.db: $!";
41
42 my $sections = retrieve "$DBDIR/sections.info";
43 my $subsections = retrieve "$DBDIR/subsections.info";
44 my $priorities = retrieve "$DBDIR/priorities.info";
45
46 use Data::Dumper;
47 #print STDERR Dumper($sections, $subsections, $priorities);
48
49 my @PACKAGES = sort keys %packages;
50 my @SRC_PACKAGES = sort keys %src_packages;
51
52 print "Found ".scalar(@PACKAGES)." packages\n";
53 print "Found ".scalar(@SRC_PACKAGES)." source packages\n";
54
55 my $template = new Packages::Template( "$TOPDIR/templates", 'html');
56 my $txt_template = new Packages::Template( "$TOPDIR/templates", 'txt');
57
58 my $charset = 'UTF-8';
59 my (%cat, %lang_vars, $prov_string, %s, %fh);
60 foreach my $lang (@LANGUAGES) {
61     $cat{$lang} = Packages::I18N::Locale->get_handle($lang)
62         or die "get_handle failed for $lang";
63     $lang_vars{$lang} = { po_lang => $lang, ddtp_lang => $lang,
64                           charset => $charset,
65                           cat => $cat{$lang}, used_langs => \@LANGUAGES };
66     $s{begin}{$lang} = '['.uc($lang).':';
67     $s{end}{$lang} = ':'.uc($lang).']';
68     $prov_string .= $s{begin}{$lang}.$cat{$lang}->g('virtual package provided by').$s{end}{$lang};
69 }
70
71 sub open_file {
72     my ($key, $vars, $file) = @_;
73
74     $file ||= 'index';
75
76     print "opening $key\n";
77     mkdirp ( "$wwwdir/$key" );
78     open($fh{$key}, '>',
79          "$wwwdir/$key/$file.slices.new")
80         or die "Cannot open file $wwwdir/$key/$file.slices.new: $!";
81
82     foreach my $lang (@LANGUAGES) {
83         print {$fh{$key}} "$s{begin}{$lang}\n";
84         $template->page( 'index_head',
85                          { %{$lang_vars{$lang}},
86                            %$vars },
87                          $fh{$key});
88         print {$fh{$key}} "\n$s{end}{$lang}\n";
89     }
90 }
91
92 sub close_file {
93     my ($key, $vars, $file) = @_;
94
95     $file ||= 'index';
96
97     print "closing $key\n";
98
99     foreach my $lang (@LANGUAGES) {
100         print {$fh{$key}} "$s{begin}{$lang}\n";
101         $template->page( 'index_foot',
102                          { %{$lang_vars{$lang}},
103                            %$vars },
104                          $fh{$key});
105         print {$fh{$key}} "\n$s{end}{$lang}\n";
106     }
107     close($fh{$key})
108         or die "Cannot close file $wwwdir/$key/$file.slices.new: $!";
109
110     activate("$wwwdir/$key/$file.slices");
111 }
112
113
114 sub open_txt_file {
115     my ($key, $vars, $file) = @_;
116
117     $file ||= 'allpackages';
118     my $lang = 'en';
119
120     print "opening $key (txt,lang=$lang)\n";
121     mkdirp ( "$wwwdir/$key" );
122     $fh{"$key/$lang/txt"} = gzopen("$wwwdir/$key/$file.$lang.txt.gz.new", 'wb9')
123         or die "Cannot open file $wwwdir/$key/$file.$lang.txt.gz.new: $!";
124
125     my $gztxt = $txt_template->page( 'index_head',
126                                      { %{$lang_vars{$lang}},
127                                        %$vars });
128     $fh{"$key/$lang/txt"}->gzwrite($gztxt);
129 }
130
131 sub close_txt_file {
132     my ($key, $vars, $file) = @_;
133
134     $file ||= 'allpackages';
135     my $lang = 'en';
136
137     print "closing $key (txt,lang=$lang)\n";
138     my $gztxt = $txt_template->page( 'index_foot',
139                                      { %{$lang_vars{$lang}},
140                                        %$vars });
141     $fh{"$key/$lang/txt"}->gzwrite($gztxt);
142     ($fh{"$key/$lang/txt"}->gzclose == Z_OK) or
143         warn("can't close text index file $wwwdir/$key/$file.$lang.txt.gz.new: "
144              . $fh{"$key/$lang/txt"}->gzerror);
145     activate("$wwwdir/$key/$file.$lang.txt.gz");
146 }
147
148
149 print "write headers ...\n";
150 foreach my $source (("", "source/")) {
151     foreach my $s (@SUITES) {
152         mkdirp ( "$wwwdir/$source$s" );
153         my %common_vars = ( suite => $s,
154                             is_source => $source );
155
156         open_file("$source$s", \%common_vars, 'allpackages');
157         open_txt_file("$source$s", \%common_vars, 'allpackages');
158
159         foreach my $sec (keys %{$sections->{$s}}) {
160             open_file("$source$s/$sec",
161                       { %common_vars,
162                         category => { id => N_('Section'),
163                                       name => $sec }});
164         }
165         foreach my $ssec ((keys %{$subsections->{$s}}, 'virtual')) {
166             next if $ssec eq '-';
167             open_file("$source$s/$ssec",
168                       { %common_vars,
169                         category => { id => N_('Subsection'),
170                                       name => $ssec }});
171         }
172         foreach my $prio (keys %{$priorities->{$s}}) {
173             next if $prio eq '-';
174             open_file("$source$s/$prio",
175                       { %common_vars,
176                         category => { id => N_('Priority'),
177                                       name => $prio }});
178         }
179     }
180 }
181
182
183 print "processing package info ...\n";
184 my $count = 0;
185 foreach my $pkg (@PACKAGES) {
186     warn "pkg=$pkg\n" if DEBUG;
187     print "$count\n" unless ++$count % 1000;
188
189     my (%pkg,%virt);
190     my ($virt, $p_data) = split /\000/o, $packages{$pkg}, 2;
191     %virt = split /\01/o, $virt;
192     foreach (split /\000/o, $p_data||'') {
193         my @data = split ( /\s/o, $_, 9 );
194         $pkg{$data[1]} ||= new Packages::Page( $pkg );
195         $pkg{$data[1]}->merge_package( { package => $pkg,
196                                          archive => $data[0],
197                                          suite => $data[1],
198                                          architecture => $data[2],
199                                          section => $data[3],
200                                          subsection => $data[4],
201                                          priority => $data[5],
202                                          version => $data[6],
203                                          'description-md5' => $data[7],
204                                          description => $data[8] } );
205     }
206     foreach (keys %virt) {
207         next if $_ eq '-';
208         $pkg{$_} ||= new Packages::Page( $pkg );
209         $pkg{$_}->add_provided_by([split /\s+/, $virt{$_}]);
210     }
211
212     while (my ($suite, $entry) = each %pkg) {
213
214         warn "\tsuite=$suite\n" if DEBUG;
215         my %p = ( name => $pkg, providers => [], versions => '' );
216         if (my $provided_by = $entry->{provided_by}) {
217             $p{providers} = $provided_by;
218         }
219         $p{subsection} = $p{section} = $p{archive} =
220             $p{desc} = $p{priority} = '';
221         unless ($entry->is_virtual) {
222             (undef, $p{versions}) = $entry->get_version_string;
223             $p{subsection} = $entry->get_newest( 'subsection' );
224             $p{section} = $entry->get_newest( 'section' );
225             $p{archive} = $entry->get_newest( 'archive' );
226             $p{desc} = $entry->get_newest( 'description' );
227             my $desc_md5 = $entry->get_newest( 'description-md5' );
228             my $trans_desc = $desctrans{$desc_md5};
229             if ($trans_desc) {
230                 my %sdescs;
231                 my %trans_desc = split /\000|\001/, $trans_desc;
232                 while (my ($l, $d) = each %trans_desc) {
233                     $d =~ s/\n.*//os;
234
235                     $sdescs{$l} = $d;
236                 }
237                 $p{trans_desc} = \%sdescs;
238             }
239             $p{priority} = $entry->get_newest( 'priority' );
240         }
241
242         my $html = my $txt = "";
243         my $id = " id='$p{name}'";
244         if ($p{versions}) {
245             warn "\tversions=$p{versions}\n" if DEBUG;
246
247             $html .= "\n<dt><a href='$p{name}'$id>$p{name}</a> ($p{versions})";
248             $id = "";
249             $html .= " [<strong class='pmarker'>$p{section}</strong>]"
250                 if $p{section} ne 'main';
251             $html .= " [<strong class='pmarker'>$p{archive}</strong>]"
252                 if $p{archive} ne 'us';
253             $html .= "</dt>\n<dd";
254
255             $txt .= "\n$p{name} ($p{versions})";
256             $txt .= " [$p{section}]" if $p{section} ne 'main';
257             $txt .= " [$p{archive}]" if $p{archive} ne 'us';
258             $txt .= " ";
259
260             if ($p{trans_desc}) {
261                 foreach my $lang (@LANGUAGES) {
262                     my ($sdesc, $sdesc_html, $desclang) = ($p{desc},
263                                                            encode_entities($p{desc}, '<>&"\''),
264                                                            'en');
265                     if ($p{trans_desc}{$lang}) {
266                         $sdesc = $p{trans_desc}{$lang};
267                         $sdesc_html = encode_entities($sdesc, '<>&"\'');
268                         $desclang = $lang;
269                     }
270
271                     $html .= $s{begin}{$lang};
272                     $html .= " lang='$desclang'" if $desclang ne $lang;
273                     $html .= ">$sdesc_html$s{end}{$lang}";
274                 }
275             } else {
276                 $html .= " lang='en'>".encode_entities($p{desc}, '<>&"\'');
277             }
278             $html .= "</dd>";
279             $txt .= $p{desc};
280         }
281
282         if (@{$p{providers}}) {
283             warn "\tproviders=@{$p{providers}}\n" if DEBUG;
284             $html .= "\n<dt><a href='$p{name}'$id>$p{name}</a></dt><dd>$prov_string ";
285             my @prov;
286             foreach my $prov (@{$p{providers}}) {
287                 my $prov_uri = uri_escape($prov);
288                 push @prov, "<a href='../$prov_uri'>$prov</a>";
289             }
290             $html .= join(', ', @prov)."</dd>";
291             $txt .= "\n$p{name} virtual package provided by ".
292                 join(', ', @{$p{providers}});
293         }
294         warn "HTML=$html\n" if DEBUG > 1;
295         warn "TXT=$txt\n" if DEBUG > 1;
296
297         print {$fh{$suite}} $html;
298         $fh{"$suite/en/txt"}->gzwrite($txt);
299         foreach my $key (qw(section subsection priority)) {
300             next unless $fh{"$suite/$p{$key}"};
301             warn "\t\t$suite/$p{$key}\n" if DEBUG;
302             print {$fh{"$suite/$p{$key}"}} $html;
303         }
304     }
305 }
306
307 print "collecting source package info ...\n";
308 $count = 0;
309 foreach my $pkg (@SRC_PACKAGES) {
310     warn "pkg=$pkg\n" if DEBUG;
311     print "$count\n" unless ++$count % 1000;
312
313     my %pkg;
314     foreach (split /\000/o, $src_packages{$pkg}||'') {
315         my @data = split ( /\s/o, $_ );
316         $pkg{$data[1]} ||= new Packages::SrcPage( $pkg );
317         $pkg{$data[1]}->merge_package( { package => $pkg,
318                                          archive => $data[0],
319                                          suite => $data[1],
320                                          section => $data[2],
321                                          subsection => $data[3],
322                                          priority => $data[4],
323                                          version => $data[5],
324                                          } );
325     }
326
327     while (my ($suite, $entry) = each %pkg) {
328         my %p = ( name => $pkg, providers => [], versions => '' );
329         $p{versions} = $entry->{version};
330         $p{subsection} = $entry->get_newest( 'subsection' );
331         $p{section} = $entry->get_newest( 'section' );
332         $p{archive} = $entry->get_newest( 'archive' );
333         $p{priority} = $entry->get_newest( 'priority' );
334
335         $p{desc} = '';
336         $p{binaries} = [];
337 #       my $binaries = find_binaries( $pkg, $p{archive}, $p{suite}, \%src2bin );
338 #       if ($binaries && @$binaries) {
339 #           pkg_list( \%packages, $opts, $binaries, 'en', $contents{binaries} );
340 #       }
341
342         my $html = my $txt = "";
343         warn "\tversions=$p{versions}\n" if DEBUG;
344
345         $html .= "\n<dt><a href='$p{name}' id='$p{name}'>$p{name}</a> ($p{versions})";
346         $html .= " [<strong class='pmarker'>$p{section}</strong>]"
347             if $p{section} ne 'main';
348         $html .= " [<strong class='pmarker'>$p{archive}</strong>]"
349             if $p{archive} ne 'us';
350         $html .= "</dt>";
351
352         $txt .= "\n$p{name} ($p{versions})";
353         $txt .= " [$p{section}]" if $p{section} ne 'main';
354         $txt .= " [$p{archive}]" if $p{archive} ne 'us';
355
356         warn "HTML=$html\n" if DEBUG > 1;
357         warn "TXT=$txt\n" if DEBUG > 1;
358
359         print {$fh{"source/$suite"}} $html;
360         $fh{"source/$suite/en/txt"}->gzwrite($txt);
361         foreach my $key (qw(section subsection priority)) {
362             next unless $fh{"source/$suite/$p{$key}"};
363             warn "\t\tsource/$suite/$p{$key}\n" if DEBUG;
364             print {$fh{"source/$suite/$p{$key}"}} $html;
365         }
366     }
367 }
368
369
370 print "write footers ...\n";
371 foreach my $source (("", "source/")) {
372     foreach my $s (@SUITES) {
373         my %common_vars = ( suite => $s,
374                             is_source => $source );
375         close_file("$source$s", \%common_vars, 'allpackages');
376         close_txt_file("$source$s", \%common_vars, 'allpackages');
377
378         foreach my $sec (keys %{$sections->{$s}}) {
379             close_file("$source$s/$sec",
380                        { %common_vars,
381                          category => { id => N_('Section'),
382                                        name => $sec }});
383         }
384         foreach my $ssec ((keys %{$subsections->{$s}}, 'virtual')) {
385             next if $ssec eq '-';
386             close_file("$source$s/$ssec",
387                        { %common_vars,
388                          category => { id => N_('Subsection'),
389                                        name => $ssec }});
390         }
391         foreach my $prio (keys %{$priorities->{$s}}) {
392             next if $prio eq '-';
393             close_file("$source$s/$prio",
394                        { %common_vars,
395                          category => { id => N_('Priority'),
396                                        name => $prio }});
397         }
398     }
399 }
400
401 __END__