FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2519, 555 aa 1>>>pF1KE2519 555 - 555 aa - 555 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.3774+/-0.000823; mu= 14.8859+/- 0.050 mean_var=101.4837+/-20.477, 0's: 0 Z-trim(110.1): 18 B-trim: 69 in 1/50 Lambda= 0.127314 statistics sampled from 11359 (11372) to 11359 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.711), E-opt: 0.2 (0.349), width: 16 Scan time: 2.860 The best scores are: opt bits E(32554) CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 ( 556) 3749 699.0 3.7e-201 CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 ( 602) 3749 699.1 3.9e-201 CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 ( 607) 3749 699.1 4e-201 CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 ( 626) 3513 655.7 4.6e-188 CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 ( 618) 1386 265.0 1.8e-70 CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 ( 609) 1369 261.9 1.6e-69 CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 ( 625) 1369 261.9 1.6e-69 CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 ( 479) 352 75.1 2.2e-13 CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 ( 504) 351 74.9 2.6e-13 CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 ( 540) 347 74.2 4.6e-13 CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12 ( 502) 339 72.7 1.2e-12 >>CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 (556 aa) initn: 3749 init1: 3749 opt: 3749 Z-score: 3724.9 bits: 699.0 E(32554): 3.7e-201 Smith-Waterman score: 3749; 100.0% identity (100.0% similar) in 555 aa overlap (1-555:2-556) 10 20 30 40 50 pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILSSSTGGRNDQGKRYYHGMEYETDLTPLESP ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MMRVNGDDDSVAALSFLYDYYMGPKEKRILSSSTGGRNDQGKRYYHGMEYETDLTPLESP 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 THLMKFLTENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLPAGPSKLEAGSVDSYLLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 THLMKFLTENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLPAGPSKLEAGSVDSYLLP 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE2 TTDMYDNGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 TTDMYDNGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE2 LKSDFEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 LKSDFEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVV 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE2 FDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 FDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNE 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE2 EAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 EAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAER 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE2 KMRDDERKQFRRKVKCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KMRDDERKQFRRKVKCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFS 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE2 SLQRSGGAAPSAGPSSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 SLQRSGGAAPSAGPSSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEV 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE2 FDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 FDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLL 490 500 510 520 530 540 540 550 pF1KE2 DMGELDGKIQIILKEL :::::::::::::::: CCDS53 DMGELDGKIQIILKEL 550 >>CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 (602 aa) initn: 3749 init1: 3749 opt: 3749 Z-score: 3724.4 bits: 699.1 E(32554): 3.9e-201 Smith-Waterman score: 3749; 100.0% identity (100.0% similar) in 555 aa overlap (1-555:48-602) 10 20 30 pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS :::::::::::::::::::::::::::::: CCDS44 VNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDSVAALSFLYDYYMGPKEKRILS 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE2 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE2 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE2 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ 200 210 220 230 240 250 220 230 240 250 260 270 pF1KE2 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV 260 270 280 290 300 310 280 290 300 310 320 330 pF1KE2 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID 320 330 340 350 360 370 340 350 360 370 380 390 pF1KE2 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG 380 390 400 410 420 430 400 410 420 430 440 450 pF1KE2 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE 440 450 460 470 480 490 460 470 480 490 500 510 pF1KE2 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS44 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK 500 510 520 530 540 550 520 530 540 550 pF1KE2 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL ::::::::::::::::::::::::::::::::::::::::::::: CCDS44 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL 560 570 580 590 600 >>CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 (607 aa) initn: 3749 init1: 3749 opt: 3749 Z-score: 3724.3 bits: 699.1 E(32554): 4e-201 Smith-Waterman score: 3749; 100.0% identity (100.0% similar) in 555 aa overlap (1-555:53-607) 10 20 30 pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS :::::::::::::::::::::::::::::: CCDS25 VNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDSVAALSFLYDYYMGPKEKRILS 30 40 50 60 70 80 40 50 60 70 80 90 pF1KE2 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG 90 100 110 120 130 140 100 110 120 130 140 150 pF1KE2 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE2 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE2 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE2 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID 330 340 350 360 370 380 340 350 360 370 380 390 pF1KE2 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG 390 400 410 420 430 440 400 410 420 430 440 450 pF1KE2 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE 450 460 470 480 490 500 460 470 480 490 500 510 pF1KE2 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK 510 520 530 540 550 560 520 530 540 550 pF1KE2 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL ::::::::::::::::::::::::::::::::::::::::::::: CCDS25 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL 570 580 590 600 >>CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 (626 aa) initn: 3513 init1: 3513 opt: 3513 Z-score: 3489.9 bits: 655.7 E(32554): 4.6e-188 Smith-Waterman score: 3513; 100.0% identity (100.0% similar) in 518 aa overlap (1-518:48-565) 10 20 30 pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS :::::::::::::::::::::::::::::: CCDS25 VNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDSVAALSFLYDYYMGPKEKRILS 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE2 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE2 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE2 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ 200 210 220 230 240 250 220 230 240 250 260 270 pF1KE2 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV 260 270 280 290 300 310 280 290 300 310 320 330 pF1KE2 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID 320 330 340 350 360 370 340 350 360 370 380 390 pF1KE2 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG 380 390 400 410 420 430 400 410 420 430 440 450 pF1KE2 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE 440 450 460 470 480 490 460 470 480 490 500 510 pF1KE2 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS25 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK 500 510 520 530 540 550 520 530 540 550 pF1KE2 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL :::::::: CCDS25 VYKKCKRGETSLLHPRLSRHPPPDCLECSHPVTQVRNMGFGDGFWRQRDLDSNPSPTTVN 560 570 580 590 600 610 >>CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 (618 aa) initn: 1346 init1: 848 opt: 1386 Z-score: 1378.6 bits: 265.0 E(32554): 1.8e-70 Smith-Waterman score: 1472; 44.8% identity (68.7% similar) in 578 aa overlap (1-555:49-618) 10 20 30 pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS : .:::.::.:::..::::: :.:.: . CCDS33 LYPQRRSYTSEDEAWKSFLENPLTAATKAMMSINGDEDSAAALGLLYDYYKVPRERRSST 20 30 40 50 60 70 40 50 60 70 pF1KE2 SSTGGRN---DQGKRYYHGMEYETDL-TPLESPTHLMKFLTENVS-------GTPEYPDL .. .. :..:: . : : . :. ....: . :. : . : CCDS33 AKPEVEHPEPDHSKRNSIPIVTEQPLISAGENRVQVLKNVPFNIVLPHGNQLGIDKRGHL 80 90 100 110 120 130 80 90 100 110 120 130 pF1KE2 LKKNNLMSLEGALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTD----MYDNGSLNSLFES .. ... : : .. . : . .: . : ..: . .. : : CCDS33 TAPDTTVTVSIAT-MPTHSIKTETQPHGFAVGIPPAVYHPEPTERVVVFDRNLNTDQFSS 140 150 160 170 180 190 140 150 160 170 180 pF1KE2 IHGVPPTQRWQPDSTFKDDPQESM---LFPDILKTSPEPPCPEDY--PSLK-SDFEYTLG .: .:: :::::.. .:.. .::. :. ::: :.. ..::::: CCDS33 GAQAPNAQRRTPDSTFSETFKEGVQEVFFPSDLSLRMPGMNSEDYVFDSVSGNNFEYTLE 200 210 220 230 240 250 190 200 210 220 230 240 pF1KE2 SPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQ . :... : :.: :.:::::::::.::. ....:. .::.::.:::: ..: .: CCDS33 ASKSLRQKPGDSTMTYLNKGQFYPITLKEVSSSEGIHHPISKVRSVIMVVFAEDKSREDQ 260 270 280 290 300 310 250 260 270 280 290 300 pF1KE2 LRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNC :: ::.::::: ::::: ::.:: ::.:::. .:::.::::.::.:..:.::::::.::: CCDS33 LRHWKYWHSRQHTAKQRCIDIADYKESFNTISNIEEIAYNAISFTWDINDEAKVFISVNC 320 330 340 350 360 370 310 320 330 340 350 360 pF1KE2 LSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQF :::::::::::::.:::.:.:::. . ... :::: ::::.:::::::::.::.:::: CCDS33 LSTDFSSQKGVKGLPLNIQVDTYSYNNRSNKPVHRAYCQIKVFCDKGAERKIRDEERKQS 380 390 400 410 420 430 370 380 390 400 410 420 pF1KE2 RRKVKCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAP .::: : :: :: . . . : ..: ::.: ::::::.:::..:::. . : CCDS33 KRKV-------SDVKVPLLPSHKRMDITVFKPFIDLDTQPVLFIPDVHFANLQRGTHVLP 440 450 460 470 480 490 430 440 450 460 470 480 pF1KE2 SAGPSSSNRLP-LKRTCSPFTEEFEPLPS-KQAKEGDLQRVLLYVRRETEEVFDALMLKT :. .. ::: ..: :: : :. . .:::::::.:.::::::::::: CCDS33 IASEELEGEGSVLKRGPYGTEDDFAVPPSTKLARIEEPKRVLLYVRKESEEVFDALMLKT 500 510 520 530 540 550 490 500 510 520 530 540 pF1KE2 PDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGK :.:::: .:::.:: :...: :..::::.:::::::.::..::::. .: :.. : :. CCDS33 PSLKGLMEAISDKYDVPHDKIGKIFKKCKKGILVNMDDNIVKHYSNEDTFQLQIEEAGGS 560 570 580 590 600 610 550 pF1KE2 IQIILKEL .. : :. CCDS33 YKLTLTEI >>CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 (609 aa) initn: 1492 init1: 815 opt: 1369 Z-score: 1361.8 bits: 261.9 E(32554): 1.6e-69 Smith-Waterman score: 1502; 44.8% identity (70.7% similar) in 583 aa overlap (1-555:36-609) 10 20 30 pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS : .:::.::.:::..::::: :..::.:: CCDS83 PFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDSAAALGLLYDYYKVPRDKRLLS 10 20 30 40 50 60 40 50 60 70 80 pF1KE2 SS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMS : . ...:: :: : : ...:. :. ....: . :.: . .. . :... CCDS83 VSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTVPVNLSLNQDHLENSKREQY-- 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE2 LEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYDNGSLNS----LFESI-HGVPP .. : ..: .: .: . ..: . .. : :. . .::. . :: CCDS83 ---SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGEEQRVVIFEQTQYDVPS 130 140 150 160 170 180 150 160 170 180 190 pF1KE2 T----------QRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSD-FEYTLGS :: ::::.... ... . .... : . .: :.::: . CCDS83 LATHSAYLKDDQRSTPDSTYSESFKDAA--TEKFRSASVGAEEYMYDQTSSGTFQYTLEA 190 200 210 220 230 200 210 220 230 240 250 pF1KE2 PKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQL :... :.::.::.:::::::: .:: . .: . .::.:::::::...: ::: CCDS83 TKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVVMVVFSEDKNRDEQL 240 250 260 270 280 290 260 270 280 290 300 310 pF1KE2 RFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCL ..::.::::: ::::::.:.:: ::.:::. .:::.::::.::.:.::::::.:: :::: CCDS83 KYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWDVNEEAKIFITVNCL 300 310 320 330 340 350 320 330 340 350 360 370 pF1KE2 STDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFR ::::::::::::.:: .:::::. . ... .::: ::::.:::::::::.::.:::: : CCDS83 STDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKGAERKIRDEERKQNR 360 370 380 390 400 410 380 390 400 410 420 pF1KE2 RKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQR .: : : .::.. . . :. . .. ::.. ::.. ::::::.:::..::: CCDS83 KKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTMPDLHSQPVLFIPDVHFANLQR 420 430 440 450 460 470 430 440 450 460 470 480 pF1KE2 SGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFDA .: . .. .. . .:: :. ::: :.:::: :: .:::::::.::..:::: CCDS83 TGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLLYVRKETDDVFDA 480 490 500 510 520 530 490 500 510 520 530 540 pF1KE2 LMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDMG ::::.: .::: .:::::::.: :.: :.::: :.:::::::.:::.::::. .:.:.: CCDS83 LMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEHYSNEDTFILNME 540 550 560 570 580 590 550 pF1KE2 ELDGKIQIILKEL . ... : :. CCDS83 SMVEGFKVTLMEI 600 >>CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 (625 aa) initn: 1492 init1: 815 opt: 1369 Z-score: 1361.6 bits: 261.9 E(32554): 1.6e-69 Smith-Waterman score: 1502; 44.8% identity (70.7% similar) in 583 aa overlap (1-555:52-625) 10 20 30 pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS : .:::.::.:::..::::: :..::.:: CCDS34 PFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDSAAALGLLYDYYKVPRDKRLLS 30 40 50 60 70 80 40 50 60 70 80 pF1KE2 SS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMS : . ...:: :: : : ...:. :. ....: . :.: . .. . :... CCDS34 VSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTVPVNLSLNQDHLENSKREQY-- 90 100 110 120 130 90 100 110 120 130 140 pF1KE2 LEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYDNGSLNS----LFESI-HGVPP .. : ..: .: .: . ..: . .. : :. . .::. . :: CCDS34 ---SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGEEQRVVIFEQTQYDVPS 140 150 160 170 180 190 150 160 170 180 190 pF1KE2 T----------QRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSD-FEYTLGS :: ::::.... ... . .... : . .: :.::: . CCDS34 LATHSAYLKDDQRSTPDSTYSESFKDAA--TEKFRSASVGAEEYMYDQTSSGTFQYTLEA 200 210 220 230 240 250 200 210 220 230 240 250 pF1KE2 PKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQL :... :.::.::.:::::::: .:: . .: . .::.:::::::...: ::: CCDS34 TKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVVMVVFSEDKNRDEQL 260 270 280 290 300 310 260 270 280 290 300 310 pF1KE2 RFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCL ..::.::::: ::::::.:.:: ::.:::. .:::.::::.::.:.::::::.:: :::: CCDS34 KYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWDVNEEAKIFITVNCL 320 330 340 350 360 370 320 330 340 350 360 370 pF1KE2 STDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFR ::::::::::::.:: .:::::. . ... .::: ::::.:::::::::.::.:::: : CCDS34 STDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKGAERKIRDEERKQNR 380 390 400 410 420 430 380 390 400 410 420 pF1KE2 RKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQR .: : : .::.. . . :. . .. ::.. ::.. ::::::.:::..::: CCDS34 KKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTMPDLHSQPVLFIPDVHFANLQR 440 450 460 470 480 490 430 440 450 460 470 480 pF1KE2 SGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFDA .: . .. .. . .:: :. ::: :.:::: :: .:::::::.::..:::: CCDS34 TGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLLYVRKETDDVFDA 500 510 520 530 540 550 490 500 510 520 530 540 pF1KE2 LMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDMG ::::.: .::: .:::::::.: :.: :.::: :.:::::::.:::.::::. .:.:.: CCDS34 LMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEHYSNEDTFILNME 560 570 580 590 600 610 550 pF1KE2 ELDGKIQIILKEL . ... : :. CCDS34 SMVEGFKVTLMEI 620 >>CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 (479 aa) initn: 189 init1: 97 opt: 352 Z-score: 353.8 bits: 75.1 E(32554): 2.2e-13 Smith-Waterman score: 360; 24.4% identity (54.3% similar) in 438 aa overlap (156-531:21-452) 130 140 150 160 170 180 pF1KE2 NGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFE .. . .: :.: ::. : .. CCDS21 MLFWHTQPEHYNQHNSGSYLRDVLALP-IFKQEEPQLSPENEARLPP-LQ 10 20 30 40 190 200 210 220 230 240 pF1KE2 YTLGSPKAIHIKSGESPMAYLNKGQFYPVTL-RTPAGGKGLALSSNKVKSVVMVVFDNEK :.: . . .: : ..:::.:: : . : .. : :... :::.. ::: ... CCDS21 YVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRR 50 60 70 80 90 100 250 260 270 280 290 300 pF1KE2 VPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEEAKV . . . . :. .: .:..:. : . . .. . . ::. :.:. ..:.. CCDS21 LQYTEHQQLEGWRWSRP--GDRILDI-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASA 110 120 130 140 150 160 310 320 330 340 350 pF1KE2 FIGVNCLSTDFSSQK--GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDKGAE :: :.:.::.:. .: : ::::. .::::. . : ::.: : : ::::.: :::. CCDS21 FIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHL-HSASCQIKVFKPKGAD 170 180 190 200 210 220 360 370 380 390 pF1KE2 RKMRDDERKQFRRKVKCPDSSNSGVKGCLLS------------------GFRGNETTY-- ::.. :..:. .: .. .. . . . .:. .. :. ... CCDS21 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGL 230 240 250 260 270 280 400 410 420 430 pF1KE2 ----LRPETDLETPPV---LFIPN---------VH---FSSLQRSGGAAPSAGPSSSNRL : .:. :: ..:. .: ::.. : .. .: . .: CCDS21 GEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRD 290 300 310 320 330 340 440 450 460 470 480 pF1KE2 PLKRTCSPFT--EEFEPLPSKQAK---------EGDLQRVLLYVRRETE-----EVFDAL : . :.: . :. . ..... : . .:: : .:. :. :. CCDS21 DLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAI 350 360 370 380 390 400 490 500 510 520 530 540 pF1KE2 MLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGE .:. : . :.. :.. ..:..::.. :: : ..:...:.. CCDS21 FLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIK 410 420 430 440 450 460 550 pF1KE2 LDGKIQIILKEL CCDS21 AESNDGYHIILKCGL 470 >>CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 (504 aa) initn: 205 init1: 96 opt: 351 Z-score: 352.5 bits: 74.9 E(32554): 2.6e-13 Smith-Waterman score: 351; 28.5% identity (59.9% similar) in 274 aa overlap (174-437:54-314) 150 160 170 180 190 200 pF1KE2 RWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPM : : . . :.:.. . . .: . . CCDS46 SGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEHPPFQYVMCAATSPAVKLHDETL 30 40 50 60 70 80 210 220 230 240 250 pF1KE2 AYLNKGQFYPVT-LRTPAGGKGLALSSNKVKSVVMVVFDNEKVPV---EQLRFWKHWHSR .:::.:: : . : . : .... :::.. ::: .... .::. :: :. CCDS46 TYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVFHDRRLQYTEHQQLEGWK-WN-- 90 100 110 120 130 140 260 270 280 290 300 310 pF1KE2 QPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQK .: .:..:. : . . .. . . ::. :.:. .....:: :.:.::.:. .: CCDS46 RP--GDRLLDL-DIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTSAFIQVHCISTEFTPRK 150 160 170 180 190 320 330 340 350 360 370 pF1KE2 --GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKV : ::::. .:.::. . : :..: : : ::::.: :::.::.. :..:. .: . CCDS46 HGGEKGVPFRIQVDTFKQNENGEYTDHL-HSASCQIKVFKPKGADRKQKTDREKMEKRTA 200 210 220 230 240 250 380 390 400 410 420 430 pF1KE2 KCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGP . .. . . .:. . : . ... : : :.: :.: ..:... CCDS46 HEKEKYQPSYDTTILTECSPWPDA---PTAYVNNSPS---PAPTFTSPQQSTCSVPDSNS 260 270 280 290 300 310 440 450 460 470 480 490 pF1KE2 SSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGL :: : CCDS46 SSPNHQGDGASQTSGEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGADLLKLTKEDLV 320 330 340 350 360 370 >>CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 (540 aa) initn: 230 init1: 121 opt: 347 Z-score: 348.0 bits: 74.2 E(32554): 4.6e-13 Smith-Waterman score: 355; 27.2% identity (57.1% similar) in 294 aa overlap (174-446:54-340) 150 160 170 180 190 200 pF1KE2 RWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPM : : . . :.:.. . . .: . . CCDS26 SGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEHPPFQYVMCAATSPAVKLHDETL 30 40 50 60 70 80 210 220 230 240 250 pF1KE2 AYLNKGQFYPVT-LRTPAGGKGLALSSNKVKSVVMVVFDNEKVPV---EQLRFWKHWHSR .:::.:: : . : . : .... :::.. ::: .... .::. :: :. CCDS26 TYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVFHDRRLQYTEHQQLEGWK-WN-- 90 100 110 120 130 140 260 270 280 290 300 310 pF1KE2 QPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQK .: .:..:. : . . .. . . ::. :.:. .....:: :.:.::.:. .: CCDS26 RP--GDRLLDL-DIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTSAFIQVHCISTEFTPRK 150 160 170 180 190 320 330 340 350 360 370 pF1KE2 --GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKV : ::::. .:.::. . : :..: : : ::::.: :::.::.. :..:. .: . CCDS26 HGGEKGVPFRIQVDTFKQNENGEYTDHL-HSASCQIKVFKPKGADRKQKTDREKMEKRTA 200 210 220 230 240 250 380 390 400 410 420 pF1KE2 KCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAP---- . .. . . .:. .: . : . . .: . .:: . :. .: CCDS26 HEKEKYQPSYDTTILTEMRLEPIIEDAVEHEQKKSSKRTLPADYGDSLAKRGSCSPWPDA 260 270 280 290 300 310 430 440 450 460 470 480 pF1KE2 -------SAGPSSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFDA : .:. . : . ::: CCDS26 PTAYVNNSPSPAPTFTSPQQSTCSVPDSNSSSPNHQGDGASQTSGEQIQPSATIQETQQW 320 330 340 350 360 370 555 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 03:15:20 2016 done: Tue Nov 8 03:15:20 2016 Total Scan time: 2.860 Total Display time: 0.080 Function used was FASTA [36.3.4 Apr, 2011]