Метод Arcane isPrime в Java

Рассмотрим следующий метод:

public static boolean isPrime(int n) {
    return ! (new String(new char[n])).matches(".?|(..+?)\\1+");
}

Я никогда не был гуру регулярных выражений, поэтому может ли кто-нибудь полностью объяснить, как на самом деле работает этот метод? Кроме того, эффективен ли он по сравнению с другими возможными методами определения того, является ли целое число простым?

java regex primes

arshajii 03.10.2012 источник

comment

См.: stackoverflow.com/questions/3329766/ - NullUserException 03.10.2012

comment

Хорошо, я беру свой комментарий обратно. Это действительно странно. - Petar Minchev 03.10.2012

comment

@NullUserException О, спасибо за ссылку - думаю, тогда я посмотрю, сможет ли кто-нибудь ответить на вторую часть моего вопроса. - arshajii 03.10.2012

comment

@АРС Я очень сомневаюсь, что это эффективно. - NullUserException 03.10.2012

comment

Эффективно только использование SLOC в качестве метрики. Это сводится к использованию обратной трассировки для реализации решета Эратосфена. - Foon 03.10.2012

comment

Я тоже, но жизнь полна сюрпризов. - arshajii 03.10.2012

comment

@Foon - он не реализует решето Эратосфена. Он исчерпывающе проверяет каждый делитель. (Например, если он терпит неудачу для 2, он все равно будет пытаться 4.) - Ted Hopp 03.10.2012

comment

Если кто-то не верит: ideone.com/2w2mt - Brendan Long 03.10.2012

comment

@TedHopp спасибо, что поправили меня; Я думал, что это часть отката, он помнит, какие факторы он уже сделал, но, видимо, нет... - Foon 04.10.2012

Ответы (3)

arrow_upward
10
arrow_downward

Во-первых, обратите внимание, что это регулярное выражение применяется к числам, представленным в унарной системе счета, т.е.

1       is 1
11      is 2
111     is 3
1111    is 4
11111   is 5
111111  is 6
1111111 is 7

и так далее. На самом деле можно использовать любой символ (отсюда и . в выражении), но я буду использовать "1".

Во-вторых, обратите внимание, что это регулярное выражение соответствует составным (не простым) числам; таким образом, отрицание обнаруживает первичность.

Пояснение:

Первая половина выражения,

.?

говорит, что строки "" (0) и "1" (1) совпадают, т.е. не простое (по определению, хотя это и спорно.)

Вторая половина на простом английском языке гласит:

Найдите самую короткую строку, длина которой не меньше 2, например, «11» (2). Теперь посмотрим, сможем ли мы сопоставить всю строку, повторив ее. Совпадает ли "1111" (4)? Совпадает ли "111111" (6)? Соответствует ли "11111111" (8)? И так далее. Если нет, попробуйте еще раз для следующей самой короткой строки «111» (3). И Т. Д.

Теперь вы видите, что если исходная строка не может быть сопоставлена как несколько ее подстрок, то по определению она является простой!

Кстати, нежадный оператор ? — это то, что заставляет «алгоритм» начинать с кратчайшего и подсчитывать.

Эффективность:

Это интересно, но определенно неэффективно по разным аргументам, некоторые из которых я приведу ниже:

Как отмечает @TeddHopp, хорошо известный подход решета Эратосфена не удосужился бы проверить кратные целые числа, такие как 4, 6 и 9, поскольку он уже был «посещен» при проверке кратных 2 и 3. Увы, это регулярное выражение подход исчерпывающе проверяет каждое меньшее целое число.
Как отмечает @PetarMinchev, мы можем «замкнуть» схему проверки множителей, как только достигнем квадратного корня из числа. Мы должны быть в состоянии, потому что множитель, больше, чем квадратный корень, должен сочетаться с множителем, меньшим, чем квадратный корень (поскольку в противном случае два множителя, большие, чем квадратный корень, дали бы произведение больше, чем число), и если этот больший множитель существует, то мы должны были уже встретить (и, следовательно, сопоставить) меньший множитель.
Как кратко отмечают @Jesper и @Brian, с неалгоритмической точки зрения рассмотрите, как регулярное выражение должно начинаться с выделения памяти для хранения строки, например, char[9000] для 9000 ... Ну, это было легко, не так ли? ;)
Как отмечает @Foon, существуют вероятностные методы, которые могут быть более эффективными для больших чисел, хотя они не всегда могут быть правильными (вместо этого появляются псевдопростые числа). Но также существуют детерминированные тесты, которые на 100% точны и намного эффективнее, чем методы на основе сита. Wolfram содержит хорошее резюме.

slackwing 03.10.2012

comment

+1 за унарное объяснение, но на самом деле это не касается эффективности. - Brian; 03.10.2012

comment

@PetarMinchev - А, я вижу, вы упомянули ту же тактику sqrt, но клянусь, я не видел вашего решения, когда писал свое. Я играю в игру в нью-йоркском метро, где пытаюсь определить, является ли 4-значный номер тележки, в которой я нахожусь, простым, прежде чем я доберусь до места назначения, и наткнулся на эту подсказку. Я поставлю вам +1, когда мой дневной лимит голосов будет сброшен :) - slackwing; 04.10.2012

comment

@Brian Легко понять, насколько это ужасно неэффективно. Он начинается уже с выделения массива char[n]. Если n большое, будет выделен огромный массив. Так что это изящный, но непрактичный трюк. - Jesper; 04.10.2012

comment

@ Джеспер Точно. При тестовом значении 9 000 он создает строку длиной 9 000 символов, затем пытается выполнить для нее регулярное выражение. Такие трюки иногда сводят меня с ума. Да, это выглядит круто, но это не очень хорошее решение при любом натяжении воображения. - Brian; 04.10.2012

comment

@Brian - Итак, представьте, что произойдет, если мы наберем БОЛЕЕ 9000?!?! - slackwing; 04.10.2012

comment

@acheong87 Хотел бы я +9000 за это :D - Brian; 04.10.2012

comment

@acheong87 - Мне нравятся такие игры. Я также иногда проверяю, являются ли номера автомобилей простыми :) Лол, я думаю, мы задроты;) - Petar Minchev; 04.10.2012

arrow_upward
5
arrow_downward

Унарные характеристики простых чисел и почему это работает, уже были рассмотрены. Итак, вот тест с использованием обычных подходов и этого подхода:

public class Main {

    public static void main(String[] args) {
        long time = System.nanoTime();
        for (int i = 2; i < 10000; i++) {
            isPrimeOld(i);
        }
        time = System.nanoTime() - time;
        System.out.println(time + " ns (" + time / 1000000 + " ms)");
        time = System.nanoTime();
        for (int i = 2; i < 10000; i++) {
            isPrimeRegex(i);
        }
        time = System.nanoTime() - time;
        System.out.println(time + " ns (" + time / 1000000 + " ms)");
        System.out.println("Done");
    }

    public static boolean isPrimeRegex(int n) {
        return !(new String(new char[n])).matches(".?|(..+?)\\1+");
    }

    public static boolean isPrimeOld(int n) {
        if (n == 2)
            return true;
        if (n < 2)
            return false;
        if ((n & 1) == 0)
            return false;
        int limit = (int) Math.round(Math.sqrt(n));
        for (int i = 3; i <= limit; i += 2) {
            if (n % i == 0)
                return false;
        }
        return true;
    }
}

Этот тест вычисляет, является ли число простым до 9999, начиная с 2. И вот его вывод на относительно мощном сервере:

8537795 ns (8 ms)
30842526146 ns (30842 ms)
Done

Таким образом, это крайне неэффективно, когда числа становятся достаточно большими. (Для до 999 регулярное выражение выполняется примерно за 400 мс.) Для небольших чисел это быстро, но все же быстрее генерировать простые числа до 9999 обычным способом, чем даже генерировать простые числа до 99 старым способом ( 23 мс).

Brian 03.10.2012

comment

Одно замечание: это не распространяется на вероятностные простые числа, потому что вероятностные простые числа обычно используются для очень больших чисел. Этот алгоритм плохо работает с числами до 9999, не говоря уже о числах с десятками цифр, поэтому я исключил его из анализа. - Brian; 04.10.2012

comment

Придирки, но если n равно 2, то код не работает. if ((n & 1) == 0) вернет false до перехода к n == 2 проверке. - Petar Minchev; 04.10.2012

comment

@PetarMinchev Да, я это видел, спасибо :) Кроме того, ты пропустил мой i++ вместо i += 2 ;) - Brian; 04.10.2012

arrow_upward
2
arrow_downward

Это не очень эффективный способ проверить, является ли число простым (он проверяет каждый делитель).

Эффективным способом является проверка делителей до sqrt(number). Это если вы хотите быть уверенным, является ли число простым. В противном случае есть вероятностные проверки простоты, которые быстрее, но не на 100% правильны.

Petar Minchev 03.10.2012

comment

Зависит от того, хотите ли вы быть уверенным или просто достаточно уверенным... вероятностные проверки простоты намного эффективнее для больших # - Foon; 03.10.2012

Метод Arcane isPrime в Java

Ответы (3)

Похожие вопросы