FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3181, 418 aa 1>>>pF1KE3181 418 - 418 aa - 418 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8603+/-0.00085; mu= 14.7544+/- 0.051 mean_var=76.5875+/-15.543, 0's: 0 Z-trim(107.8): 19 B-trim: 0 in 0/50 Lambda= 0.146553 statistics sampled from 9808 (9815) to 9808 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.676), E-opt: 0.2 (0.301), width: 16 Scan time: 2.780 The best scores are: opt bits E(32554) CCDS1876.1 PELI1 gene_id:57162|Hs108|chr2 ( 418) 2921 627.0 1e-179 CCDS9726.1 PELI2 gene_id:57161|Hs108|chr14 ( 420) 2481 533.9 1.1e-151 CCDS41675.1 PELI3 gene_id:246330|Hs108|chr11 ( 445) 2138 461.4 7.5e-130 CCDS31615.1 PELI3 gene_id:246330|Hs108|chr11 ( 469) 2040 440.7 1.4e-123 CCDS73328.1 PELI3 gene_id:246330|Hs108|chr11 ( 406) 1894 409.8 2.4e-114 >>CCDS1876.1 PELI1 gene_id:57162|Hs108|chr2 (418 aa) initn: 2921 init1: 2921 opt: 2921 Z-score: 3339.8 bits: 627.0 E(32554): 1e-179 Smith-Waterman score: 2921; 100.0% identity (100.0% similar) in 418 aa overlap (1-418:1-418) 10 20 30 40 50 60 pF1KE3 MFSPDQENHPSKAPVKYGELIVLGYNGSLPNGDRGRRKSRFALFKRPKANGVKPSTVHIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 MFSPDQENHPSKAPVKYGELIVLGYNGSLPNGDRGRRKSRFALFKRPKANGVKPSTVHIA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 CTPQAAKAISNKDQHSISYTLSRAQTVVVEYTHDSNTDMFQIGRSTESPIDFVVTDTVPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 CTPQAAKAISNKDQHSISYTLSRAQTVVVEYTHDSNTDMFQIGRSTESPIDFVVTDTVPG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 SQSNSDTQSVQSTISRFACRIICERNPPFTARIYAAGFDSSKNIFLGEKAAKWKTSDGQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 SQSNSDTQSVQSTISRFACRIICERNPPFTARIYAAGFDSSKNIFLGEKAAKWKTSDGQM 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 DGLTTNGVLVMHPRNGFTEDSKPGIWREISVCGNVFSLRETRSAQQRGKMVEIETNQLQD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 DGLTTNGVLVMHPRNGFTEDSKPGIWREISVCGNVFSLRETRSAQQRGKMVEIETNQLQD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 GSLIDLCGATLLWRTAEGLSHTPTVKHLEALRQEINAARPQCPVGFNTLAFPSMKRKDVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 GSLIDLCGATLLWRTAEGLSHTPTVKHLEALRQEINAARPQCPVGFNTLAFPSMKRKDVV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 DEKQPWVYLNCGHVHGYHNWGNKEERDGKDRECPMCRSVGPYVPLWLGCEAGFYVDAGPP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 DEKQPWVYLNCGHVHGYHNWGNKEERDGKDRECPMCRSVGPYVPLWLGCEAGFYVDAGPP 310 320 330 340 350 360 370 380 390 400 410 pF1KE3 THAFSPCGHVCSEKTTAYWSQIPLPHGTHTFHAACPFCAHQLAGEQGYIRLIFQGPLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS18 THAFSPCGHVCSEKTTAYWSQIPLPHGTHTFHAACPFCAHQLAGEQGYIRLIFQGPLD 370 380 390 400 410 >>CCDS9726.1 PELI2 gene_id:57161|Hs108|chr14 (420 aa) initn: 2515 init1: 2427 opt: 2481 Z-score: 2837.0 bits: 533.9 E(32554): 1.1e-151 Smith-Waterman score: 2481; 81.4% identity (94.8% similar) in 420 aa overlap (1-418:1-420) 10 20 30 40 50 pF1KE3 MFSPDQENH--PSKAPVKYGELIVLGYNGSLPNGDRGRRKSRFALFKRPKANGVKPSTVH :::: ::.: :.: :::::::.::::::.:::::::::::::::.:::::::::::::: CCDS97 MFSPGQEEHCAPNKEPVKYGELVVLGYNGALPNGDRGRRKSRFALYKRPKANGVKPSTVH 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE3 IACTPQAAKAISNKDQHSISYTLSRAQTVVVEYTHDSNTDMFQIGRSTESPIDFVVTDTV . ::::.:::: : :::::::::: ::::::::::..:::::.:::::::::::::::. CCDS97 VISTPQASKAISCKGQHSISYTLSRNQTVVVEYTHDKDTDMFQVGRSTESPIDFVVTDTI 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE3 PGSQSNSDTQSVQSTISRFACRIICERNPPFTARIYAAGFDSSKNIFLGEKAAKWKTSDG :::.....: .:::::::::::.:.:: :.::::.::::::::::::::::::::. :: CCDS97 SGSQNTDEAQITQSTISRFACRIVCDRNEPYTARIFAAGFDSSKNIFLGEKAAKWKNPDG 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE3 QMDGLTTNGVLVMHPRNGFTEDSKPGIWREISVCGNVFSLRETRSAQQRGKMVEIETNQL .:::::::::::::::.::::.:.::.::::::::.:..::::::::::::.:: ::: : CCDS97 HMDGLTTNGVLVMHPRGGFTEESQPGVWREISVCGDVYTLRETRSAQQRGKLVESETNVL 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE3 QDGSLIDLCGATLLWRTAEGLSHTPTVKHLEALRQEINAARPQCPVGFNTLAFPSMKRKD ::::::::::::::::::.:: :::: ::.:::::::::::::::::.:::::::..::. CCDS97 QDGSLIDLCGATLLWRTADGLFHTPTQKHIEALRQEINAARPQCPVGLNTLAFPSINRKE 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE3 VVDEKQPWVYLNCGHVHGYHNWGNKEERDGKDRECPMCRSVGPYVPLWLGCEAGFYVDAG ::.:::::.::.:::::::::::.. . ....:::::::.:::::::::::::::::::: CCDS97 VVEEKQPWAYLSCGHVHGYHNWGHRSDTEANERECPMCRTVGPYVPLWLGCEAGFYVDAG 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE3 PPTHAFSPCGHVCSEKTTAYWSQIPLPHGTHTFHAACPFCAHQLAGEQGYIRLIFQGPLD ::::::.:::::::::.. ::::::::::::.::::::::: ::.:::. :.::::::.: CCDS97 PPTHAFTPCGHVCSEKSAKYWSQIPLPHGTHAFHAACPFCATQLVGEQNCIKLIFQGPID 370 380 390 400 410 420 >>CCDS41675.1 PELI3 gene_id:246330|Hs108|chr11 (445 aa) initn: 1061 init1: 1061 opt: 2138 Z-score: 2444.7 bits: 461.4 E(32554): 7.5e-130 Smith-Waterman score: 2138; 70.5% identity (88.5% similar) in 417 aa overlap (3-418:30-445) 10 20 30 pF1KE3 MFSPDQENHPSKAPVKYGELIVLGYNGSLPNGD :: .. .:.. :.:::::::::::: : .:: CCDS41 MVLEGNPEVGSPRTSDLQHRGNKGSCVLSSPGEDAQPGEEPIKYGELIVLGYNGCLASGD 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE3 RGRRKSRFALFKRPKANGVKPSTVHIACTPQAAKAISNKDQHSISYTLSRAQTVVVEYTH .:::.::.:: .: .::::::...: :: ..::.::. ::::::::::...:.::::: CCDS41 KGRRRSRLALSRRSHANGVKPDVMHHISTPLVSKALSNRGQHSISYTLSRSHSVIVEYTH 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE3 DSNTDMFQIGRSTESPIDFVVTDTVPGSQSNSDTQSVQSTISRFACRIICERNPPFTARI ::.:::::::::::. :::::::: ::. . .. :.::::::.::::.:.: ::.:::: CCDS41 DSDTDMFQIGRSTENMIDFVVTDTSPGG-GAAEGPSAQSTISRYACRILCDRRPPYTARI 130 140 150 160 170 160 170 180 190 200 210 pF1KE3 YAAGFDSSKNIFLGEKAAKWKTSDGQMDGLTTNGVLVMHPRNGFTEDSKPGIWREISVCG ::::::.:.::::::.::::.: :: :::::::::::::: .::.::: ::.:::::::: CCDS41 YAAGFDASSNIFLGERAAKWRTPDGLMDGLTTNGVLVMHPAGGFSEDSAPGVWREISVCG 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE3 NVFSLRETRSAQQRGKMVEIETNQLQDGSLIDLCGATLLWRTAEGLSHTPTVKHLEALRQ ::..::..::::::::.:: :.: :::::::::::::::::: :: ..::.:.::: :: CCDS41 NVYTLRDSRSAQQRGKLVENESNVLQDGSLIDLCGATLLWRTPAGLLRAPTLKQLEAQRQ 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE3 EINAARPQCPVGFNTLAFPSMKR-KDVVDEKQPWVYLNCGHVHGYHNWGNKEERDGKDRE : ::::::::::..:::::: : . . :..:::::. ::::::::.:: ..:: ..:: CCDS41 EANAARPQCPVGLSTLAFPSPARGRTAPDKQQPWVYVRCGHVHGYHGWGCRRERGPQERE 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE3 CPMCRSVGPYVPLWLGCEAGFYVDAGPPTHAFSPCGHVCSEKTTAYWSQIPLPHGTHTFH ::.:: :::::::::: :::. .: :::.:::.::::::::::. ::.: :::::::.:: CCDS41 CPLCRLVGPYVPLWLGQEAGLCLDPGPPSHAFAPCGHVCSEKTARYWAQTPLPHGTHAFH 360 370 380 390 400 410 400 410 pF1KE3 AACPFCAHQLAGEQGYIRLIFQGPLD ::::::. :.::.: .::::::::: CCDS41 AACPFCGAWLTGEHGCVRLIFQGPLD 420 430 440 >>CCDS31615.1 PELI3 gene_id:246330|Hs108|chr11 (469 aa) initn: 1047 init1: 963 opt: 2040 Z-score: 2332.4 bits: 440.7 E(32554): 1.4e-123 Smith-Waterman score: 2080; 66.7% identity (83.7% similar) in 441 aa overlap (3-418:30-469) 10 20 pF1KE3 MFSPDQENHPSKAPVKYGELIVLG--------- :: .. .:.. :.::::::::: CCDS31 MVLEGNPEVGSPRTSDLQHRGNKGSCVLSSPGEDAQPGEEPIKYGELIVLGCCEEGGEET 10 20 30 40 50 60 30 40 50 60 pF1KE3 ---------------YNGSLPNGDRGRRKSRFALFKRPKANGVKPSTVHIACTPQAAKAI ::: : .::.:::.::.:: .: .::::::...: :: ..::. CCDS31 EAQRGEVTGPRAHSCYNGCLASGDKGRRRSRLALSRRSHANGVKPDVMHHISTPLVSKAL 70 80 90 100 110 120 70 80 90 100 110 120 pF1KE3 SNKDQHSISYTLSRAQTVVVEYTHDSNTDMFQIGRSTESPIDFVVTDTVPGSQSNSDTQS ::. ::::::::::...:.:::::::.:::::::::::. :::::::: ::. . .. : CCDS31 SNRGQHSISYTLSRSHSVIVEYTHDSDTDMFQIGRSTENMIDFVVTDTSPGG-GAAEGPS 130 140 150 160 170 130 140 150 160 170 180 pF1KE3 VQSTISRFACRIICERNPPFTARIYAAGFDSSKNIFLGEKAAKWKTSDGQMDGLTTNGVL .::::::.::::.:.: ::.::::::::::.:.::::::.::::.: :: :::::::::: CCDS31 AQSTISRYACRILCDRRPPYTARIYAAGFDASSNIFLGERAAKWRTPDGLMDGLTTNGVL 180 190 200 210 220 230 190 200 210 220 230 240 pF1KE3 VMHPRNGFTEDSKPGIWREISVCGNVFSLRETRSAQQRGKMVEIETNQLQDGSLIDLCGA :::: .::.::: ::.::::::::::..::..::::::::.:: :.: :::::::::::: CCDS31 VMHPAGGFSEDSAPGVWREISVCGNVYTLRDSRSAQQRGKLVENESNVLQDGSLIDLCGA 240 250 260 270 280 290 250 260 270 280 290 300 pF1KE3 TLLWRTAEGLSHTPTVKHLEALRQEINAARPQCPVGFNTLAFPSMKR-KDVVDEKQPWVY :::::: :: ..::.:.::: ::: ::::::::::..:::::: : . . :..::::: CCDS31 TLLWRTPAGLLRAPTLKQLEAQRQEANAARPQCPVGLSTLAFPSPARGRTAPDKQQPWVY 300 310 320 330 340 350 310 320 330 340 350 360 pF1KE3 LNCGHVHGYHNWGNKEERDGKDRECPMCRSVGPYVPLWLGCEAGFYVDAGPPTHAFSPCG . ::::::::.:: ..:: ..::::.:: :::::::::: :::. .: :::.:::.::: CCDS31 VRCGHVHGYHGWGCRRERGPQERECPLCRLVGPYVPLWLGQEAGLCLDPGPPSHAFAPCG 360 370 380 390 400 410 370 380 390 400 410 pF1KE3 HVCSEKTTAYWSQIPLPHGTHTFHAACPFCAHQLAGEQGYIRLIFQGPLD :::::::. ::.: :::::::.::::::::. :.::.: .::::::::: CCDS31 HVCSEKTARYWAQTPLPHGTHAFHAACPFCGAWLTGEHGCVRLIFQGPLD 420 430 440 450 460 >>CCDS73328.1 PELI3 gene_id:246330|Hs108|chr11 (406 aa) initn: 1014 init1: 926 opt: 1894 Z-score: 2166.5 bits: 409.8 E(32554): 2.4e-114 Smith-Waterman score: 1894; 72.6% identity (89.4% similar) in 358 aa overlap (62-418:50-406) 40 50 60 70 80 90 pF1KE3 GDRGRRKSRFALFKRPKANGVKPSTVHIACTPQAAKAISNKDQHSISYTLSRAQTVVVEY :: ..::.::. ::::::::::...:.::: CCDS73 RGNKGSCVLSSPGEDAQPGEEPIKYGELISTPLVSKALSNRGQHSISYTLSRSHSVIVEY 20 30 40 50 60 70 100 110 120 130 140 150 pF1KE3 THDSNTDMFQIGRSTESPIDFVVTDTVPGSQSNSDTQSVQSTISRFACRIICERNPPFTA ::::.:::::::::::. :::::::: ::. . .. :.::::::.::::.:.: ::.:: CCDS73 THDSDTDMFQIGRSTENMIDFVVTDTSPGG-GAAEGPSAQSTISRYACRILCDRRPPYTA 80 90 100 110 120 130 160 170 180 190 200 210 pF1KE3 RIYAAGFDSSKNIFLGEKAAKWKTSDGQMDGLTTNGVLVMHPRNGFTEDSKPGIWREISV ::::::::.:.::::::.::::.: :: :::::::::::::: .::.::: ::.:::::: CCDS73 RIYAAGFDASSNIFLGERAAKWRTPDGLMDGLTTNGVLVMHPAGGFSEDSAPGVWREISV 140 150 160 170 180 190 220 230 240 250 260 270 pF1KE3 CGNVFSLRETRSAQQRGKMVEIETNQLQDGSLIDLCGATLLWRTAEGLSHTPTVKHLEAL ::::..::..::::::::.:: :.: :::::::::::::::::: :: ..::.:.::: CCDS73 CGNVYTLRDSRSAQQRGKLVENESNVLQDGSLIDLCGATLLWRTPAGLLRAPTLKQLEAQ 200 210 220 230 240 250 280 290 300 310 320 330 pF1KE3 RQEINAARPQCPVGFNTLAFPSMKR-KDVVDEKQPWVYLNCGHVHGYHNWGNKEERDGKD ::: ::::::::::..:::::: : . . :..:::::. ::::::::.:: ..:: .. CCDS73 RQEANAARPQCPVGLSTLAFPSPARGRTAPDKQQPWVYVRCGHVHGYHGWGCRRERGPQE 260 270 280 290 300 310 340 350 360 370 380 390 pF1KE3 RECPMCRSVGPYVPLWLGCEAGFYVDAGPPTHAFSPCGHVCSEKTTAYWSQIPLPHGTHT ::::.:: :::::::::: :::. .: :::.:::.::::::::::. ::.: :::::::. CCDS73 RECPLCRLVGPYVPLWLGQEAGLCLDPGPPSHAFAPCGHVCSEKTARYWAQTPLPHGTHA 320 330 340 350 360 370 400 410 pF1KE3 FHAACPFCAHQLAGEQGYIRLIFQGPLD ::::::::. :.::.: .::::::::: CCDS73 FHAACPFCGAWLTGEHGCVRLIFQGPLD 380 390 400 418 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:58:26 2016 done: Sun Nov 6 01:58:26 2016 Total Scan time: 2.780 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]