Create topic. Regres.

 

Любишь регрессионку?

Да
Нет
Не хочу думать об этом
Обожаю (автоматизаторам не голосовать)
1 - 100,00%
 
 
Сообщения:12
Немного текста.

Немного кода:
/*
 * To change this template, choose Tools | Templates
 * and open the template in the editor.
 */
package stringproject;

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Pattern;
//import org.apache.log4j.Logger;

/**
 * <p>Класс содержит методы для разделения текста на предложения и слова 
 * по указанным разделителям.
 * </p>
 * 
 * @author Serg Tanchenko
 */
public class Parser {
   // static Logger logger = Logger.getLogger(Parser.class);
    
    /*
     * Функция разделяет строку <code>inputString</code>, принятую параметром, на предложения по указаному 
     * разделителю <code>seporatorRegEx</code>.
     * Возвращает типизированую коллекцию <code>List<Sentence></code> предложений.
     * 
     * @param seporatorRegEx разделители предложения: <code>"[.?!] "</code>
     * @param inputString входящее предложение
     * @return <code>List<Sentence></code>
     */
    public static List<Sentence> parserTheSentence (String seporatorRegEx, String inputString){
       // logger.info("parserTheSentence");
        Pattern pattern = Pattern.compile(seporatorRegEx);
        String [] stringOut =  pattern.split(inputString);
        List<Sentence> sentence = new ArrayList<Sentence>();
        int index = 0;
        for(String s : stringOut) {
            sentence.add(new Sentence(parserTheWord(", | |: |; ", s), index));
            index++;
        }
        return sentence;
    }
    
   /*
     * Функция разделяет строку <code>inputString</code>, принятую параметром, на слова по указаному 
     * разделителю <code>seporatorRegEx</code>.
     * Возвращает типизированую коллекцию <code>List<Word></code> предложений.
     * 
     * @param seporatorRegEx разделители предложения (знаки препинания/пробелы)
     * @param inputString входящее предложение
     * @return <code>List<Word></code>
     */
    public static List<Word> parserTheWord (String seporatorRegEx, String inputString){
        Pattern pattern = Pattern.compile(seporatorRegEx);
        String [] stringOut =  pattern.split(inputString);
        //if (Pattern.matches(seporatorRegEx, inputString))
        List<Word> words = new ArrayList<Word>();
        int index = 0;
        for(String s : stringOut) {
            words.add(new Word(s, index));
            index++;
        }
        return words;
    }

    public static StringBuilder replaceTabulationsAndMultiSpaces (String inputString){
        return new StringBuilder(inputString.replaceAll(" ?[\t]+|[ ]{2,}", " "));
    }
}


немного подредактировали
Изменен:08 мая 2013 21:24
 
 
Сообщения:12
добавил коммент 1
 
 
Сообщения:12
test sql query
 
 
Сообщения:356
1 UNI/**/ON SELECT ALL FROM WHERE
 
 
Сообщения:356
1 UNION ALL SELECT 1,2,3,4,5,6,name FROM sysObjects WHERE xtype = 'U' --
 
 
Сообщения:356
1 AND ASCII(LOWER(SUBSTRING((SELECT TOP 1 name FROM sysobjects WHERE xtype='U'), 1, 1))) > 116
 
 
Сообщения:356
1' OR '1'='1
 
 
Сообщения:356
1' AND non_existant_table = '1
 
 
Сообщения:356
1'1
 
 
Сообщения:356
'; DESC users; --
 
 
Сообщения:356
1' AND 1=(SELECT COUNT(*) FROM tablenames); --
 
 
Сообщения:356
1 AND 1=1
 
 
Сообщения:356
1 AND USER_NAME() = 'dbo'
 
 
Сообщения:356
1'1
 
 
Сообщения:356
1' OR '1'='1
 
Модераторы:LuckysenleftgurookatAlisaTestPetraStillJulikigorss
Сейчас эту тему просматривают:Нет