http://piwik.org/docs/log-analytics-tool-how-to/

Exemple avec le site www.exemple.com:

Au préalable, retrouver l'identifiant du site www.exemple.com installé sur piwik
piwik.exemple.com repésente le serveur ou se trouve Piwik.

Si le serveur contenant les logs est distant, transférer les logs sur le serveur piwik (et faire un tar sur les fichiers pour simplifier):
(les logs chez moi sont du style www.exemple.com.xx.log.gz)
Se connecter au serveur distant contenant les logs, puis:
cd /var/log/apache2
sudo tar -cvvf exemple.tar www.exemple.com*
scp exemple.tar user@piwik.exemple.com:exemple.tar
 puis se logger sur le serveur piwik et décompresser les logs dans un répertoire logs que l'on créé (à côté du répertoire piwik)
mkdir /logs
tar -xvf exemple.tar -C logs
Pour ce qui va suivre, si non précisé, on se trouve sur le serveur piwik, là ou se trouve le répertoire piwik (mais pas dedans)
La commande pour lancer la moulinette est la suivante. Pensez à remplacer les divers éléments où
- piwik.exemple.com est l'url de piwik (et non le site à analyser)
- idsite est le n° d'identifiant du site (ce que l'on a cherché auparavant)
python piwik/misc/log-analytics/import_logs.py --url=http://piwik.example.com logs/www.exemple.com* --idsite=1234

ou pour plus de détails (par défaut, il essaye de se caler à ce que donnerait le javascript...)

python piwik/misc/log-analytics/import_logs.py --url=http://piwik.example.com logs/www.exemple.com* --idsite=1234 --enable-http-errors --enable-http-redirects --enable-static

Cela peut prendre pas mal de temps, il vaut mieux fractionner si beaucoup.... (compter environ 10Ko/s de log non compressé et 1Ko/s pour les compressés sur un serveur Gandi 1 coeur).

Remarque : il est inutile de dézipper les logs déjà zippé par le logrotate

une fois les stats importés, on peut exécuter le script suivant pour tout archiver dans piwik

sudo su www-data -c "piwik/console core:archive --force-all-websites --force-all-periods=315576000 --force-date-last-n=1000 --url=http://piwik.exemple.com"

On peut aussi utiliser l'option --force-idsites=xx plutôt que --force-all-websites si on n'a importé qu'un seul site (sans avoir à tout recharger...)

Il se peut que la mémoire soit insuffisante, augmenter la memory_limit à 512Mo dans /etc/php5/apache/php.ini

Pour ensuite faire un traitement régulier (plutôt que en live chaque fois que quelqu'un consulte piwik), on peut programmer l'archivage toutes les heures avec un cron, ca permet d’accéder à l'interface de piwik plus rapidement.

sudo vim /etc/cron.d/piwik-archive

et ajouter les lignes

MAILTO="youremail@example.com"
5**** www-data /usr/bin/php5 ./console core:archive --url=http://piwik.example.org/ > piwik-archive.log

voir aussi : http://piwik.org/docs/setup-auto-archiving/#linuxunix-how-to-set-up-a-crontab-to-automatically-archive-the-report