]> git.deb.at Git - deb/packages.git/blob - lib/Packages/DoSearch.pm
77bedfb999927899b8e291c036abdd9738a0eefb
[deb/packages.git] / lib / Packages / DoSearch.pm
1 package Packages::DoSearch;
2
3 use strict;
4 use warnings;
5
6 use Benchmark ':hireswallclock';
7 use DB_File;
8 use Exporter;
9 our @ISA = qw( Exporter );
10 our @EXPORT = qw( do_search );
11
12 use Deb::Versions;
13 use Packages::I18N::Locale;
14 use Packages::Search qw( :all );
15 use Packages::CGI qw( :DEFAULT );
16 use Packages::DB;
17 use Packages::Config qw( $DBDIR @SUITES @ARCHIVES $ROOT );
18
19 sub do_search {
20     my ($params, $opts, $page_content) = @_;
21
22     $Params::Search::too_many_hits = 0;
23
24     if ($params->{errors}{keywords}) {
25         fatal_error( _g( "keyword not valid or missing" ) );
26         $opts->{keywords} = [];
27     } elsif (grep { length($_) < 2 } @{$opts->{keywords}}) {
28         fatal_error( _g( "keyword too short (keywords need to have at least two characters)" ) );
29     }
30
31     my @keywords = @{$opts->{keywords}};
32     my $searchon = $opts->{searchon};
33     $page_content->{search_keywords} = \@keywords;
34
35     my $st0 = new Benchmark;
36     my (@results, @non_results);
37
38     unless (@Packages::CGI::fatal_errors) {
39
40         if ($searchon eq 'names') {
41             if ($opts->{source}) {
42                 do_names_search( [ @keywords ], \%sources, $sp_obj,
43                                  \&read_src_entry_all, $opts,
44                                  \@results, \@non_results );
45             } else {
46                 do_names_search( [ @keywords ], \%packages, $p_obj,
47                                  \&read_entry_all, $opts,
48                                  \@results, \@non_results );
49             }
50         } else {
51             do_names_search( [ @keywords ], \%packages, $p_obj,
52                              \&read_entry_all, $opts,
53                              \@results, \@non_results );
54             my $fts1 = new Benchmark;
55             do_xapian_search( [ @keywords ], "$DBDIR/xapian/",
56                                 \%did2pkg, \%packages,
57                                 \&read_entry_all, $opts,
58                                 \@results, \@non_results );
59             my $fts2 = new Benchmark;
60             my $fts_xapian = timediff($fts2,$fts1);
61             debug( "Fulltext search took ".timestr($fts_xapian) )
62                 if DEBUG;
63         }
64     }
65
66 #    use Data::Dumper;
67 #    debug( join( "", Dumper( \@results, \@non_results )) ) if DEBUG;
68     my $st1 = new Benchmark;
69     my $std = timediff($st1, $st0);
70     debug( "Search took ".timestr($std) ) if DEBUG;
71
72     $page_content->{too_many_hits} = $Packages::Search::too_many_hits;
73     #FIXME: non_results can't be compared to results since it is
74     # not normalized to unique packages
75     $page_content->{non_results} = scalar @non_results;
76
77     if (@results) {
78         my (%pkgs, %subsect, %sect, %archives, %desc, %binaries, %provided_by);
79
80         my %sort_by_relevance;
81         for (1 ... scalar @results) {
82 #           debug("$results[$_][0] => $_", 4) if DEBUG;
83             $sort_by_relevance{$results[$_-1][0]} = $_;
84         }
85 #       use Data::Dumper;
86 #       debug( "sort_by_relevance=".Dumper(\%sort_by_relevance), 4);
87
88         unless ($opts->{source}) {
89             foreach (@results) {
90                 my ($pkg_t, $archive, $suite, $arch, $section, $subsection,
91                     $priority, $version, $desc) = @$_;
92
93                 my ($pkg) = $pkg_t =~ m/^(.+)/; # untaint
94                 if ($arch ne 'virtual') {
95                     $pkgs{$pkg}{$suite}{$version}{$arch} = 1;
96                     $subsect{$pkg}{$suite}{$version} = $subsection;
97                     $sect{$pkg}{$suite}{$version} = $section;
98                     $archives{$pkg}{$suite}{$version} ||= $archive;
99
100                     $desc{$pkg}{$suite}{$version} = $desc;
101                 } else {
102                     $provided_by{$pkg}{$suite} = [ split /\s+/, $desc ];
103                 }
104             }
105
106             my %uniq_pkgs = map { $_ => 1 } (keys %pkgs, keys %provided_by);
107             my @pkgs;
108             if ($searchon eq 'names') {
109                 @pkgs = sort keys %uniq_pkgs;
110             } else {
111                 @pkgs = sort { $sort_by_relevance{$a} <=> $sort_by_relevance{$b} } keys %uniq_pkgs;
112             }
113             process_packages( $page_content, 'packages', \%pkgs, \@pkgs, $opts, \@keywords,
114                               \&process_package, \%provided_by,
115                               \%archives, \%sect, \%subsect,
116                               \%desc );
117
118         } else { # unless $opts->{source}
119             foreach (@results) {
120                 my ($pkg, $archive, $suite, $section, $subsection, $priority,
121                     $version) = @$_;
122
123                 my $real_archive = '';
124                 if ($archive eq 'security') {
125                     $real_archive = $archive;
126                     $archive = 'us';
127                 }
128                 if (($real_archive eq $archive) &&
129                     $pkgs{$pkg}{$suite}{$archive} &&
130                     (version_cmp( $pkgs{$pkg}{$suite}{$archive}, $version ) >= 0)) {
131                     next;
132                 }
133                 $pkgs{$pkg}{$suite}{$archive} = $version;
134                 $subsect{$pkg}{$suite}{$archive}{source} = $subsection;
135                 $sect{$pkg}{$suite}{$archive}{source} = $section
136                     unless $section eq 'main';
137                 $archives{$pkg}{$suite}{$archive}{source} = $real_archive
138                     if $real_archive;
139
140                 $binaries{$pkg}{$suite}{$archive} = find_binaries( $pkg, $archive, $suite, \%src2bin );
141             }
142
143             my @pkgs = sort keys %pkgs;
144             process_packages( $page_content, 'src_packages', \%pkgs, \@pkgs, $opts, \@keywords,
145                               \&process_src_package, \%archives,
146                               \%sect, \%subsect, \%binaries );
147         } # else unless $opts->{source}
148     } # if @results
149 } # sub do_search
150
151 sub process_packages {
152     my ($content, $target, $pkgs, $pkgs_list, $opts, $keywords, $print_func, @func_args) = @_;
153
154     my @categories;
155     $content->{results} = scalar @$pkgs_list;
156
157     my $keyword;
158     $keyword = $keywords->[0] if @$keywords == 1;
159             
160     my $have_exact;
161     if ($keyword && grep { $_ eq $keyword } @$pkgs_list) {
162         $have_exact = 1;
163         $categories[0]{name} = _g( "Exact hits" );
164
165         $categories[0]{$target} = [ &$print_func( $keyword, $pkgs->{$keyword}||{},
166                                                    map { $_->{$keyword}||{} } @func_args ) ];
167         @$pkgs_list = grep { $_ ne $keyword } @$pkgs_list;
168     }
169             
170     if (@$pkgs_list && (($opts->{searchon} ne 'names') || !$opts->{exact})) {
171         my %cat;
172         $cat{name} = _g( 'Other hits' ) if $have_exact;
173         
174         $cat{packages} = [];
175         foreach my $pkg (@$pkgs_list) {
176             push @{$cat{$target}}, &$print_func( $pkg, $pkgs->{$pkg}||{},
177                                                  map { $_->{$pkg}||{} } @func_args );
178         }
179         push @categories, \%cat;
180     } elsif (@$pkgs_list) {
181         $content->{skipped} = scalar @$pkgs_list;
182     }
183
184     $content->{categories} = \@categories;
185 }
186
187 sub process_package {
188     my ($pkg, $pkgs, $provided_by, $archives, $sect, $subsect, $desc) = @_;
189
190     my %pkg = ( pkg => $pkg,
191                 suites => [] );
192
193     foreach my $suite (@SUITES) {
194         my %suite = ( suite => $suite );
195         if (exists $pkgs->{$suite}) {
196             my %archs_printed;
197             my @versions = version_sort keys %{$pkgs->{$suite}};
198             $suite{section} = $sect->{$suite}{$versions[0]};
199             $suite{subsection} = $subsect->{$suite}{$versions[0]};
200             $suite{desc} = $desc->{$suite}{$versions[0]};
201             $suite{versions} = [];
202                 
203             foreach my $v (@versions) {
204                 my %version;
205                 $version{version} = $v;
206                 $version{archive} = $archives->{$suite}{$v};
207                     
208                 $version{architectures} = [ grep { !$archs_printed{$_} } sort keys %{$pkgs->{$suite}{$v}} ];
209                 push @{$suite{versions}}, \%version if @{$version{architectures}};
210
211                 $archs_printed{$_}++ foreach @{$version{architectures}};
212             }
213             if (my $p =  $provided_by->{$suite}) {
214                 $suite{providers} = $p;
215             }
216         } elsif (my $p =  $provided_by->{$suite}) {
217             $suite{desc} = _g('Virtual package');
218             $suite{providers} = $p;
219         }
220         push @{$pkg{suites}}, \%suite if $suite{versions} || $suite{providers};
221     }
222
223     return \%pkg;
224 }
225
226 sub process_src_package {
227     my ($pkg, $pkgs, $archives, $sect, $subsect, $binaries) = @_;
228
229     my %pkg = ( pkg => $pkg,
230                 origins => [] );
231
232     foreach my $suite (@SUITES) {
233         foreach my $archive (@ARCHIVES) {
234             if (exists $pkgs->{$suite}{$archive}) {
235                 my %origin;
236                 $origin{version} = $pkgs->{$suite}{$archive};
237                 $origin{suite} = $suite;
238                 $origin{archive} = $archive; 
239                 $origin{section} = $sect->{$suite}{$archive}{source};
240                 $origin{subsection} = $subsect->{$suite}{$archive}{source};
241                 $origin{real_archive} = $archives->{$suite}{$archive}{source};
242
243                 $origin{binaries} = $binaries->{$suite}{$archive};
244                 push @{$pkg{origins}}, \%origin;
245             }
246         }
247     }
248
249     return \%pkg;
250 }
251
252 1;