FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7865, 557 aa
1>>>pF1KB7865 557 - 557 aa - 557 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.8299+/-0.000917; mu= 7.8090+/- 0.055
mean_var=156.4391+/-32.174, 0's: 0 Z-trim(111.0): 31 B-trim: 20 in 1/50
Lambda= 0.102542
statistics sampled from 11987 (12009) to 11987 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.718), E-opt: 0.2 (0.369), width: 16
Scan time: 3.870
The best scores are: opt bits E(32554)
CCDS11324.1 HNF1B gene_id:6928|Hs108|chr17 ( 557) 3695 558.7 6.8e-159
CCDS58538.1 HNF1B gene_id:6928|Hs108|chr17 ( 531) 2343 358.6 1.1e-98
CCDS77007.1 HNF1B gene_id:6928|Hs108|chr17 ( 457) 1611 250.3 3.7e-66
CCDS9209.1 HNF1A gene_id:6927|Hs108|chr12 ( 631) 907 146.2 1.1e-34
CCDS76611.1 HNF1A gene_id:6927|Hs108|chr12 ( 638) 907 146.3 1.1e-34
>>CCDS11324.1 HNF1B gene_id:6928|Hs108|chr17 (557 aa)
initn: 3695 init1: 3695 opt: 3695 Z-score: 2966.2 bits: 558.7 E(32554): 6.8e-159
Smith-Waterman score: 3695; 100.0% identity (100.0% similar) in 557 aa overlap (1-557:1-557)
10 20 30 40 50 60
pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB7 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB7 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI
490 500 510 520 530 540
550
pF1KB7 STLTNMSSSKQCPLQAW
:::::::::::::::::
CCDS11 STLTNMSSSKQCPLQAW
550
>>CCDS58538.1 HNF1B gene_id:6928|Hs108|chr17 (531 aa)
initn: 2343 init1: 2343 opt: 2343 Z-score: 1885.5 bits: 358.6 E(32554): 1.1e-98
Smith-Waterman score: 3464; 95.3% identity (95.3% similar) in 557 aa overlap (1-557:1-531)
10 20 30 40 50 60
pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP
:: ::::::::::::::::::::::::::::::::
CCDS58 RQ--------------------------FSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP
190 200 210
250 260 270 280 290 300
pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF
220 230 240 250 260 270
310 320 330 340 350 360
pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI
280 290 300 310 320 330
370 380 390 400 410 420
pF1KB7 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH
340 350 360 370 380 390
430 440 450 460 470 480
pF1KB7 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS
400 410 420 430 440 450
490 500 510 520 530 540
pF1KB7 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS58 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI
460 470 480 490 500 510
550
pF1KB7 STLTNMSSSKQCPLQAW
:::::::::::::::::
CCDS58 STLTNMSSSKQCPLQAW
520 530
>>CCDS77007.1 HNF1B gene_id:6928|Hs108|chr17 (457 aa)
initn: 1611 init1: 1611 opt: 1611 Z-score: 1301.2 bits: 250.3 E(32554): 3.7e-66
Smith-Waterman score: 2732; 93.6% identity (93.8% similar) in 451 aa overlap (1-451:1-425)
10 20 30 40 50 60
pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP
::: :::::::::::::::::::::::::::::::
CCDS77 RQF--------------------------SQQSHGPGQSDDACSEPTNKKMRRNRFKWGP
190 200 210
250 260 270 280 290 300
pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF
220 230 240 250 260 270
310 320 330 340 350 360
pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 ANRRKEEAFRQKLAMDAYSSNQTHSLNPLLSHGSPHHQPSSSPPNKLSGVRYSQQGNNEI
280 290 300 310 320 330
370 380 390 400 410 420
pF1KB7 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS77 TSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTNIH
340 350 360 370 380 390
430 440 450 460 470 480
pF1KB7 SLSHHNPQQSQNLIMTPLSGVMAIAQSLNTSQAQSVPVINSVAGSLAALQPVQFSQQLHS
:::::::::::::::::::::::::: .::
CCDS77 SLSHHNPQQSQNLIMTPLSGVMAIAQMSSTSLVMPTHHLLRAQQQGPCFPHHHPLGSCHG
400 410 420 430 440 450
490 500 510 520 530 540
pF1KB7 PHQQPLMQQSPGSHMAQQPFMAAVTQLQNSHMYAHKQEPPQYSHTSRFPSAMVVTDTSSI
CCDS77 KAQ
>>CCDS9209.1 HNF1A gene_id:6927|Hs108|chr12 (631 aa)
initn: 1676 init1: 565 opt: 907 Z-score: 736.3 bits: 146.2 E(32554): 1.1e-34
Smith-Waterman score: 1852; 54.4% identity (75.9% similar) in 577 aa overlap (1-551:1-541)
10 20 30 40 50 60
pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP
:::::..:: :::.::: ::..::.:.::: : :.: . . : ::. : . .
CCDS92 MVSKLSQLQTELLAALLESGLSKEALIQALGE--PGP-YLLAGEG-PLDKGESC-GGGRG
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR
. : :: .. : : :: ..::.:. ::::::::. :. ::::.:.: :. .:.:::::
CCDS92 ELAELPNGLGETRGSEDETDDDGEDF-TPPILKELENLSPEEAAHQKAVVETLLQEDPWR
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL
.:::.:.:.::::::::::::.::::::::::::::::::::::::::::::::::::.
CCDS92 VAKMVKSYLQQHNIPQREVVDTTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREVA
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP
.::... : :.. .. . :.: :: :: :::::::::
CCDS92 QQFTHAGQ--GGLIEEPTGDEL-----------------------PT-KKGRRNRFKWGP
180 190 200
250 260 270 280 290 300
pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF
::::::.:::.:::::::::::.::::::::::.:::::::.:.::::::::::::::::
CCDS92 ASQQILFQAYERQKNPSKEERETLVEECNRAECIQRGVSPSQAQGLGSNLVTEVRVYNWF
210 220 230 240 250 260
310 320 330 340 350
pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTH-SLNPLL-SHGSPHHQPSSSPPNKLSGVRYSQQGNN
::::::::::.:::::.::. . .: : .:.:: : . :.:. ::::.: ...
CCDS92 ANRRKEEAFRHKLAMDTYSGPPPGPGPGPALPAHSSPGLPPPALSPSKVHGVRYGQPATS
270 280 290 300 310 320
360 370 380 390 400 410
pF1KB7 EITSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTN
: .. . ... .:: .. :.::::..:.:.:.::: ..:..:..:: ::::::::
CCDS92 E---TAEVPSSSGGPLVTVSTPLHQVSPTGLEPSHSLLSTEAKLVSAAGGPLPPVSTLTA
330 340 350 360 370 380
420 430 440 450
pF1KB7 IHSLSHHNP---QQSQNLIMTPLSGVMAIAQS--------------------LNTSQAQS
.::: . .: :: :::::. : :::.:. . : ..::::
CCDS92 LHSLEQTSPGLNQQPQNLIMASLPGVMTIGPGEPASLGPTFTNTGASTLVIGLASTQAQS
390 400 410 420 430 440
460 470 480 490 500 510
pF1KB7 VPVINSVAGSLAALQPVQFSQQLHSPHQQPLMQQSPGSHMAQQPFMAAVTQLQNSH-MYA
::::::...::..:::::::: :: .::::: ::..:.::::...:::. : .:.
CCDS92 VPVINSMGSSLTTLQPVQFSQPLHPSYQQPLMPPVQ-SHVTQSPFMATMAQLQSPHALYS
450 460 470 480 490 500
520 530 540 550
pF1KB7 HKQEPPQYSHTSRFPSAMVVTDTSSISTLTNMSSSKQCPLQAW
:: : ::.::. .:..:..:::...:.:.... .::
CCDS92 HKPEVAQYTHTGLLPQTMLITDTTNLSALASLTPTKQVFTSDTEASSESGLHTPASQATT
510 520 530 540 550 560
CCDS92 LHVPSQDPASIQHLQPAHRLSASPTVSSSSLVLYQSSDSSNGQSHLLPSNHSVIETFIST
570 580 590 600 610 620
>>CCDS76611.1 HNF1A gene_id:6927|Hs108|chr12 (638 aa)
initn: 1676 init1: 565 opt: 907 Z-score: 736.3 bits: 146.3 E(32554): 1.1e-34
Smith-Waterman score: 1852; 54.4% identity (75.9% similar) in 577 aa overlap (1-551:1-541)
10 20 30 40 50 60
pF1KB7 MVSKLTSLQQELLSALLSSGVTKEVLVQALEELLPSPNFGVKLETLPLSPGSGAEPDTKP
:::::..:: :::.::: ::..::.:.::: : :.: . . : ::. : . .
CCDS76 MVSKLSQLQTELLAALLESGLSKEALIQALGE--PGP-YLLAGEG-PLDKGESC-GGGRG
10 20 30 40 50
70 80 90 100 110 120
pF1KB7 VFHTLTNGHAKGRLSGDEGSEDGDDYDTPPILKELQALNTEEAAEQRAEVDRMLSEDPWR
. : :: .. : : :: ..::.:. ::::::::. :. ::::.:.: :. .:.:::::
CCDS76 ELAELPNGLGETRGSEDETDDDGEDF-TPPILKELENLSPEEAAHQKAVVETLLQEDPWR
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB7 AAKMIKGYMQQHNIPQREVVDVTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREIL
.:::.:.:.::::::::::::.::::::::::::::::::::::::::::::::::::.
CCDS76 VAKMVKSYLQQHNIPQREVVDTTGLNQSHLSQHLNKGTPMKTQKRAALYTWYVRKQREVA
120 130 140 150 160 170
190 200 210 220 230 240
pF1KB7 RQFNQTVQSSGNMTDKSSQDQLLFLFPEFSQQSHGPGQSDDACSEPTNKKMRRNRFKWGP
.::... : :.. .. . :.: :: :: :::::::::
CCDS76 QQFTHAGQ--GGLIEEPTGDEL-----------------------PT-KKGRRNRFKWGP
180 190 200
250 260 270 280 290 300
pF1KB7 ASQQILYQAYDRQKNPSKEEREALVEECNRAECLQRGVSPSKAHGLGSNLVTEVRVYNWF
::::::.:::.:::::::::::.::::::::::.:::::::.:.::::::::::::::::
CCDS76 ASQQILFQAYERQKNPSKEERETLVEECNRAECIQRGVSPSQAQGLGSNLVTEVRVYNWF
210 220 230 240 250 260
310 320 330 340 350
pF1KB7 ANRRKEEAFRQKLAMDAYSSNQTH-SLNPLL-SHGSPHHQPSSSPPNKLSGVRYSQQGNN
::::::::::.:::::.::. . .: : .:.:: : . :.:. ::::.: ...
CCDS76 ANRRKEEAFRHKLAMDTYSGPPPGPGPGPALPAHSSPGLPPPALSPSKVHGVRYGQPATS
270 280 290 300 310 320
360 370 380 390 400 410
pF1KB7 EITSSSTISHHGNSAMVTSQSVLQQVSPASLDPGHNLLSPDGKMISVSGGGLPPVSTLTN
: .. . ... .:: .. :.::::..:.:.:.::: ..:..:..:: ::::::::
CCDS76 E---TAEVPSSSGGPLVTVSTPLHQVSPTGLEPSHSLLSTEAKLVSAAGGPLPPVSTLTA
330 340 350 360 370 380
420 430 440 450
pF1KB7 IHSLSHHNP---QQSQNLIMTPLSGVMAIAQS--------------------LNTSQAQS
.::: . .: :: :::::. : :::.:. . : ..::::
CCDS76 LHSLEQTSPGLNQQPQNLIMASLPGVMTIGPGEPASLGPTFTNTGASTLVIGLASTQAQS
390 400 410 420 430 440
460 470 480 490 500 510
pF1KB7 VPVINSVAGSLAALQPVQFSQQLHSPHQQPLMQQSPGSHMAQQPFMAAVTQLQNSH-MYA
::::::...::..:::::::: :: .::::: ::..:.::::...:::. : .:.
CCDS76 VPVINSMGSSLTTLQPVQFSQPLHPSYQQPLMPPVQ-SHVTQSPFMATMAQLQSPHALYS
450 460 470 480 490 500
520 530 540 550
pF1KB7 HKQEPPQYSHTSRFPSAMVVTDTSSISTLTNMSSSKQCPLQAW
:: : ::.::. .:..:..:::...:.:.... .::
CCDS76 HKPEVAQYTHTGLLPQTMLITDTTNLSALASLTPTKQEAALLPQVFTSDTEASSESGLHT
510 520 530 540 550 560
CCDS76 PASQATTLHVPSQDPASIQHLQPAHRLSASPTVSSSSLVLYQSSDSSNGQSHLLPSNHSV
570 580 590 600 610 620
557 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 09:57:35 2016 done: Sat Nov 5 09:57:35 2016
Total Scan time: 3.870 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]